Server/Shell

Text-Processing Basic - Sorting, Counting, Fromatting, and Translating

체리필터 2006. 12. 5. 11:50
728x90
반응형
  • sort
    • sort 명령은 알파벳순으로 정렬을 시켜 출력한다.
    • 기본적으로 숫자는 정렬되지 않는다. 숫자로 정렬하려면 다른 옵션을 사용해야 한다.
    • sort 명령은 다음과 같은 옵션을 갖는다.
      • -d : Sorts in phone-directory order
      • -f : Sorts lowercase letters in the same manners as uppercase letters
      • -i : Ignotes any characters outside the ASCII range
      • -n : Sorts in numerical order instead of alphabetical
      • -r : Reverses the order of the output
  • wc
    • wc는 "word count"로 파일의 라인수, 워드수, 문자수를 출력한다
wc fileone
14   14   58   fileone
      • -c : Shows only the number of bytes or characters
      • -l : Shows only the number of lines
      • -w : Shows only the number of words
wc -w fileone
14 fileone
  • fmt
    • 지정된 너비로 출력 결과를 조정한다. 디폴트 width는 75 characters이다. -w 옵션을 통해 너비를 조정할 수 있다.
fmt fileone
seoul   1111 incheon 2222 pusan   3333 taegu   4444 daejeon 5555

fmt -w10 fileone
seoul
1111
incheon
2222
pusan
3333
taegu
4444
daejeon
5555

* 기본 옵션은 -w이다. 따라서 fmt -w10옵션과 fmt -10은 같은 결과를 보인다.
  • tr
    • tr(translate)는 문자셋을 다른 것으로 변경할 수 있다. 예를 들어 모든 소문자를 대문자로 바꾸려면
tr '[a-z]' [A-Z]' < filetwo
1111    NEWYORK
2222    LA
33333    BOSTON
4444    SAN
5555    WASHINGTON

cf) tr은 반드시 두개의 charcter sets만을 받아들이며 파일명은 사용하지 않는다. 따라서 반듣시 파일의 이름은 리다이렉트 입력기호를 사용하거나 파이프를 사용해야 한다.
    • lower : All lowercase
    • uppper : All uppercase characters
    • print : All printable characters
    • punct : Punctuation characters
    • space : All white space
    • alnum : Alpha characters and numbers
    • digit : Numbers only
    • cntrl : characters control
    • alpha : Letters only
    • graph : Printable characters but not white space
예를 들어 위에서 사용한 명령은 다음과 같이 내릴 수도 있다.

tr '[:lower:]' [:upper:]' < filetwo

Associated Utilities
  • expand - Allows you to expand tab characters into spaces. The default number of spaces per tab is eight. but you can change that using the -t option
  • file - Looks at an entry's signature and reports what type of file it is
  • more - Display only one screen of output at a time
  • split - Chops a single file into multiple files. The default is that a new file is created for every 1,000 lines of the original file. Using the -b option, you can avoid the 1,000 line splitting and specity a number of bytes to be put into each output file, or you use -l to specify a number of lines
  • uniq - Examines entries in a file, comparing the current line with the one directly preceding it, to fild lines ar unique.
  • vi - One of the greatest file editors.
728x90
반응형