Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
TÔI LẤY ĐƯỢC NÓ RỒI,
LÀM GÌ VỚI NÓ ĐÂY?
Trong chương này
Ảo ảnh của các loại đam mê
Năm cách để nén file, và làm thế nào để trả lại tình trạng cũ cho nó
Các hình ảnh được số hoá, dành cho, à, những người yêu thích nghệ
thuật
FTP bằng thư
B
ây giờ bạn đã biết cách dùng FTP và RCP, bạn có lẽ đã lấy hàng ngàn tỉ file
(vâng, có thể là ba hay bốn). Nhưng khi bạn nhìn chúng bằng trình soạn thảo văn
bản của mình, bạn có thể để ý rằng chúng chỉ là rác rến. Trong chương này, chúng
ta xem xét nhiều loại file khác nhau trên Net, làm thế nào để biết chúng là gì, và
làm gì với chúng.
Có bao nhiêu loại file?
ít nhất là hàng trăm. May mắn là chúng rơi vào một số phân loại.
Các file văn bản
Các file văn bản chứa văn bản có thể đọc được (Bạn nghĩ nó là cái gì?). Đôi
khi văn bản thực sự là văn bản nhân-loại-đọc-được (giống như bản thảo cuốn sách
này mà tôi đã gõ nó vào dưới dạng các file văn bản). Đôi khi văn bản là các mã
nguồn chương trình máy tính bằng các ngôn ngữ như C hay Pascal. Và thảng hoặc,
văn bản cũng là các dữ liệu cho các chương trình. Dữ liệu cho máy in Postcript là
một loại file văn bản đặc biệt sẽ được thảo luận sau trong chương này.
Các file thi hành được
Các file thi hành được là các chương trình thật sự mà bạn có thể chạy được
trên máy tính. Các chương trình thi hành được rất thường thấy ở những nơi chứa đồ
vớ vẩn là dành cho các máy PC và Mac. Một vài chương trình thi hành được cũng
có trên mạng cho các loại máy tính khác, như là các trạm làm việc.
Các file lưu trữ và nén
1
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Thông thường một chương trình trọn gói nào đó gồm một mớ các file liên
quan với nhau. Để dễ gởi gói này đi các nơi, các file có thể được gom lại với nhau
thành một file đơn giản gọi là một archive (Vâng, thuật ngữ archive cũng là nói
đến một máy chủ mà bạn có thể FTP đồ vớ vẩn từ đó. Xin lỗi. Cứ kiện tôi đi. ít
nhất trong chương này archive có nghĩa là nhiều file). Sau khi bạn lấy được một
archive, bạn dùng một chương trình giải lưu trữ (unarchiving program) để lấy ra
các file nguyên gốc.
Một vài file cũng được nén, nghĩa là chúng được mã hoá theo một cách đặc
biệt để ít chiếm chỗ hơn nhưng cũng chỉ có thể được giải mã bằng bộ giải mã
tương ứng. Phần lớn các file bạn lấy theo kiểu FTP vô danh là được nén bởi vì các
file nén dùng ít không gian đĩa hơn và mất ít thời gian để chuyển trên Net. Trong
thế giới PC, việc lưu trữ và nén thường đi cùng nhau, sử dụng các tiện ích như
PKZIP. Tuy nhiên, trong thế giới trạm làm việc, hai thủ tục luôn được thực hiện
riêng biệt - các chương trình tar hoặc cpio làm việc lưu trữ, các chương trình
compress, pack hay gzip làm việc nén.
Các file dữ liệu
Một vài file thì không phải là loại văn bản, thi hành được, lưu trữ, hay nén.
Không biết thuật ngữ nào tốt hơn nên tôi coi chúng là các file dữ liệu. Các chương
trình thường đi cùng với các file dữ liệu mà chương trình sử dụng. Các chương
trình Microsoft Windows thường đi cùng với các dữ liệu như file giúp đỡ.
Loại file dữ liệu bạn thường thấy nhất trên Net là các hình ảnh, phần lớn là
dạng hình GIF hoặc JPEG được số hoá. Trên Net cũng thấy ngày càng nhiều các
phim số hoá dạng GL và MPEG.
Thỉnh thoảng bạn cũng có thể thấy các file xử lý văn bản được định dạng để
dùng với các chương trình như WordPerfect và Microsoft Word. Nếu bạn gặp một
trong những file này và không có truy xuất đến chương trình xử lý văn bản tương
ứng, bạn luôn có thể nạp chúng vào một trình xử lý văn bản để thấy phần văn bản
trong file trà trộn với những thứ linh tinh không in được đại diện cho thông tin định
dạng. Cố lên thì bạn cũng có thể chỉnh xoá những ký tự linh tinh để khôi phục lại
2
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
phần văn bản. Các chương trình xử lý văn bản thường dùng nhất trên Net, tuy già
nhưng vẫn còn phục vụ tốt là TexX và troff. Cả hai đều nhận các thông tin nhập
như là các file văn bản thuần túy với các lệnh định dạng ở dạng văn bản, giống như
sau:
\begin {quote}
Your mother wears army boots.
\end {quote}
Nếu bạn muốn biết thêm về TeX, xem nhóm tin tức USENET là
comp.text.tex. Các phiên bản không mất tiền có trên hầu hết các máy, được mô tả
trong một thông điệp hàng tháng trên các nhóm tin tức. Troff thường được phân
phối cùng với các hệ UNIX; xem comp.text.tex
Chỉ là văn bản dạng thô
Không có gì nhiều để nói về các file văn bản - bạn sẽ biết chúng khi bạn thấy
chúng. Như đã nói trong chương 16, cách lưu chứa văn bản trong các hệ thống
khác nhau thì khác nhau, thành ra bạn nên FTP các file văn bản trong chế độ ASCII
để tự động chuyển chúng thành dạng thức cục bộ của bạn.
Nếu bạn gặp một file văn bản bắt đầu hơi giống như sau, thì bạn đã gặp một
file tài liệu Postcript:
%!PS-Adobe-2.0
%%Title: Some Random Document
%%CreationDate: Thu Jul 5 1990
/pl transform 0.1 sub round 0.1 add exch
0.1 sub round 0.1 add exch transform bind def
Một tài liệu Postcript thật sự là một chương trình viết trên ngôn ngữ máy
tính Postcript mô tả một tài liệu. Trừ phi bạn là một thần dân Postcript tầm cỡ thế
giới, điều duy nhất có ý nghĩa đối với một tài liệu như thế là chạy chương trình và
xem tài liệu. Cách thông thường để làm điều đó là gởi nó đến một máy in Postcript.
Các trình thông dịch Postcript, chẳng hạn GNU Ghostscript (xem chương 18), cũng
có sẵn và có thể chuyển Postcript thành các dạng thức màn hình và máy in khác.
3
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Một vài tài liệu văn bản thật sự lại là các file lưu trữ hoặc phi văn bản. Xem
phần thảo luận về các file shar và uuencoded trong phần sau của chương này.
Có yêu cầu cuối cùng nào không trước khi chúng tôi thi hành bạn?
Các chương trình thi hành được thường thấy nhất là cho DOS và Windows.
Các file này có tên file như FOOG.EXE, FOOG.COM hoặc (đôi khi for windows)
FOOG.DLL. Bạn chạy chúng cũng giống như chạy các chương trình DOS và
Windows khác.
Luôn có cơ hội cho các chương trình Mac hay PC mới bị nhiễm virus máy
tính. (bởi vì hệ thống làm việc theo cách thức khác, ít có khả năng là các file trên
các trạm làm việc có thể chứa virus). Những thư vớ vẩn từ các kho lưu trữ chạy tốt
như SIMTEL-20 và wuarchive (xem chi tiết ở chương 18) thì khó bị nhiễm; nhưng
nếu bạn chạy một chương trình ngẫu nhiên từ một chỗ ngẫu nhiên, có nhận hậu quả
gì thì cũng phải thôi. Tôi không định bài xích gì về vấn đề an toàn phần mềm ở đây
- Để biết thêm chi tiết, xem quyển DOS dành cho những người không chuyên và
Mac dành cho những người không chuyên.
Các chương trình thi hành được trên các trạm làm việc có các tên file không
dễ nhận ra, mặc dù file nào chứa tên file là dấu chấm thì hầu như là không thi hành
được. Mặc dù hầu như tất cả các loại trạm làm việc đều chạy UNIX, các file thi
hành được thì không thể trao đổi qua lại được. Ví dụ, mã chương trình cho một
máy SPARC không chạy trên IBM RS/6000, hoặc ngược lại. Nhiều phiên bản
UNIX khác nhau chạy trên các PC 386, với các dạng thức thi hành được khác nhau.
Nói chung các phiên bản UNIX mới hơn trên PC chạy được các file thi hành được
của các phiên bản cũ, nhưng điều ngược lại thì không được.
Đóng gói nó
Nếu bạn lấy nhiều file từ Net, bạn phải học cách bung các thứ đó ra. Ba loại
chương trình nén là
compress
gzip
ZIP
4
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Nén cổ điển
Trở lại năm 1975, một gã tên là Terry Welch xuất bản một bài viết về một sơ
đồ nén mới mà anh vừa phát minh ra. Một vài thảo chương viên UNIX thực hiện
nó thành chương trình compress, và nó nhanh chóng trở thành chương trình nén
chuẩn. Bây giờ thì có nhiều chương trình nén tốt hơn, nhưng chương trình
compression vẫn là chuẩn.
Bạn có thể nhận ra một chương trình được nén vì tên nó tận cùng là .Z. Bạn
khôi phục file gốc bằng một chương trình uncompress (thật sự là cùng chương
trình như compress nhưng chạy trong một chế độ khác), như trong ví dụ sau:
uncompress blurfle.Z
Lệnh này từ giã blurfle.Z và thay thế nó bằng file blurfle ban đầu. Đôi khi
chương trình giải nén không có, và bạn có thể làm tương đương như thế:
compress -d blurfle.Z
Trên các PC, Các file nén thường có tên tận cùng bằng .Z, như
BLURFLE.TAZ. Một phiên bản tương thích UNIX của compress cũng có trên
archive SIMTEL trong thư mục /msdos/compress tên là COMP430D.ZIP.(Bạn cần
phải UNZIP nó, xem phần "ZIP nó lại" ở phần sau của chương này). Thường các
file UNIX được lưu trữ và nén với các tên như blurfle.tar.Z. Trong trường hợp đó,
đầu tiên bạn phải giải nén để có file blurfle.tar rồi mới giải lưu trữ (unarchive).
Nếu bạn muốn xem những gì trong một file nén mà không cần phải giải nén
nó, bạn có thể dùng zcat, vốn gởi một bản giải nén của những gì nó nhận được ra
màn hình. File nào đủ lớn để nén thường dài hơn một màn hình, nên bạn cũng nên
chạy cùng với nó một chương trình phân trang như more:
zcat blurfle.Z | more
Điều đó hiển nhiên một cách hiển nhiên
Đôi điều mà người viết chương trình nén không nhận ra là Welch chỉ đưa ra
sơ đồ nén, anh ta cũng có sở hữu bằng phát minh đó. (Có hai gã khác ở IBM cũng
phát minh ra cùng một sơ đồ đó một cách độc lập và cũng có bằng phát minh như
thế. Điều này đúng ra không được phép vì chỉ có người phát minh đầu tiên là được
5
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
có bằng. Nhưng các bằng phát minh đó thật sự là có). UNISYS, công ty thuê
Welch, đã nói nhiều lần là một ngày nào đó nó sẽ bắt đầu thu tiền sử dụng sơ đồ
này trên các chương trình nén.
Thành ra Viện Phần mềm Miễn phí, vốn đang thực hiện một dự án phần
mềm miễn phí GNU, đã viết gzip, dùng các giải thuật 100% chưa được cấp bằng
phát minh. Các file được gzip tận cùng bằng .gz và được giải nén bằng lệnh gunzip:
gunzip blurfle.gz
Sự việc đi đến chỗ là mặc dù việc nén của compress được cấp bằng phát
minh, không ai buồn đăng ký phát minh về kỹ thuật giải nén, thành ra gunzip cũng
làm việc giải nén các file .Z của compress cũng như một số dạng có sớm hơn và ít
dùng rộng rãi hơn. Nó còn có thể giải nén một archive ZIP miễn là chỉ có một file
trong đó. Nếu bạn có một file nén bí ẩn, thử dùng gunzip và xem nó ra sao. Cũng
có chương trình gcat, giống như zcat, gởi thông tin kết xuất ra màn hình. Thành ra
cách tốt nhất để biết bên trong một file bí ẩn là đưa vào câu lệnh sau:
gcat mysteryfile | more
Phiên bản trên UNIX của gzip và gunzip cũng có trên các file GNU ở
ftp.uu.net và nơi khác, và phiên bản trên DOS có ở chỗ SIMTEL (xem chương 18)
tên là GZIP123.ZIP ở /msdos/compress
ZIP nó lại
Chương trình nén và lưu trữ thường dùng nhất trên DOS là chương trình
chia sẻ (shareware) PKZIP. Các file được zip tận cùng bằng .ZIP và có thể được
giải nén và giải lưu trữ bằng PKUNZIP, có ở SIMTEL cũng như hầu hết các BBS
trên thế giới.
Các chương trình zip và unzip tương thích với UNIX gọi là zip và unzip (tác
giả của chúng là những thảo chương viên sáng tạo chứ không phải là những người
đặt tên sáng tạo) cũng có ở ftp.uu.net và những nơi khác. Khi có vấn đề về phần
mềm chia sẻ như PKUNZIP, đã có phiên bản trên DOS của unzip trên UNIX, mặc
dù chúng chỉ nhanh bằng một nửa PKUNZIP.
Những phần mềm lưu trữ khác
6
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Cũng có hàng tá những phần mềm nén lưu trữ như LHARC, ZOO, và ARC.
Những người sử dụng Mac và DOS có thể tìm thấy chương trình giải lưu trữ cho
tất cả bọn chúng trong kho SIMTEL.
Trong các chương trình lưu trữ
Hai chương trình lưu trữ trên UNIX khác nhau là tar và cpio. Nó được viết
gần như cùng lúc bởi những người ở hai nhánh khác nhau của Bell Laboratories ở
những phần khác nhau của bang New Jersey. Chúng gần như làm công việc giống
nhau, mặc dù khác nhau.
Một khác biệt quan trọng giữa các file lưu trữ dạng UNIX và các file ZIP là
các file UNIX thường chứa các thư mục con; các file ZIP gần như không bao giờ
làm như thế. Bạn nên luôn luôn nhìn vào bảng nội dung (danh sách các file nó
chứa) của file lưu trữ UNIX trước khi trích ra các file để bạn sẽ biết các file chấm
dứt ở đâu.
Chương trình tar
Chữ tar là thay cho Tape Archive - Lưu trữ trên băng từ (đầu tiên nó được
thiết kế để đặt các file lưu trữ lên băng từ). Các file lưu trữ bằng tar thường có tên
tận cùng là.tar. Để xem những gì bên trong một file lưu trữ tar, nhập vào câu lệnh
sau:
tar tvf blurfle.tar
(tvf viết tắt của Table of contents Verbosely from File - Bảng nội dung dài
dòng lấy từ file). Để lấy các file riêng rẽ, dùng lệnh:
tar xvf blurfle.tar
Chép ở đây, chép ở kia
Tên cpio thay cho chữ CoPy In and Out - sao chép vào ra. Chương trình cũng
định chép các file lưu trữ qua lại với băng từ. (Đây đã là một vấn đề được nhấn
mạnh lại vì có những lúc các đĩa trên UNIX hư hỏng mỗi tuần 1 lần - thì băng từ là
hy vọng duy nhất để khôi phục lại công việc). Các file lưu trữ bởi cpio thường có
tên tận cùng bằng .cp hay .cpio. Để xem bên trong một file lưu trữ cpio, gõ vào như
sau:
7
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
cpio -itcv <blurfle.cpio
Chú ý dấu < (ngoặc nhọn bên trái) trước tên file nhập. (Nếu bạn thắc mắc tại
sao cần như thế, xem UNIX for dummies. Câu trả lời khá là kỹ thuật). -itcv có nghĩa
là Input, Table of contents, Character headers (để đối lại chữ octal header đã lạc
hậu), Verbosely (Input - thông tin nhập, Table of contents - bảng nội dung,
character headers - cấu trúc đầu kiểu ký tự, octal header - cấu trúc đầu kiểu bát
phân, verbosely - dài dòng).
Để lấy file ra, nhập vào như sau:
cpio -icdv <blurfle.cpio
các chữ này thay cho Input, Character headers, Verbosly, và create
Directories as needed (tạo các thư mục nếu cần).
Bình an cho anh em (PAX vobiscum)
Các phiên bản hiện đại của UNIX (kể từ khoảng 1988) có một chương trình
mới đặc sắc gọi là pax (Portable Archive eXchange - Trao đổi file lưu trữ trên máy
xách tay). Nó biết nói cả tiếng tar và cpio, thành ra có thể giải nén bất kỳ file lưu
trữ UNIX nào. (Khá tiến bộ đấy chứ? Chỉ mất 20 năm để họ nghĩ đến điều đó). Nếu
hệ thống của bạn có pax, bạn sẽ thấy nó dễ dùng hơn tar hay cpio. Để xem bên
trong một file lưu trữ, dùng lệnh sau đây:
pax -v <tar-or-cpio-file
(chữ v là thay cho từ verbose (dài) trong chữ liệt kê dài).
Và để lấy nội dung của nó, nhập vào:
pax -rv <tar-or-cpio-file
Để có khuynh hướng nghệ thuật
Một phần càng ngày càng lớn các dòng thông tin trên Internet là các hình
ảnh số hoá chất lượng ngày càng cao. Khoảng chừng 99,44% hình ảnh đơn thuần là
để giải trí, trò chơi, hay còn tệ hơn thế. Nhưng tôi bảo đảm là bạn nằm trong số
0,56% những người sử dụng cần hình ảnh đó để làm việc, vì thế sau đây là một tóm
lược về dạng thức hình ảnh.
Bạn hầu nhưng không bao giờ thấy các file GIF hay JPEG ở dạng nén hay
8
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
lưu trữ. Đó là vì những dạng file này đã nén nội bộ cũng khá nhiều thành ra chương
trình compress, zip hay tương tự không giúp gì thêm được bao nhiêu.
Tôi có thể GIF một
Dạng sử dụng rộng rãi nhất trên Internet là GIF (Graphic Interchange Format
- Dạng thức trao đổi đồ hoạ) của CompuServe. Dạng GIF thích ứng tốt với những
khả năng của một màn hình máy tính thông thường - không nhiều hơn 256 màu
trong một hình và thường có độ phân giải 640x480, 1024x768 hoặc tương tự các
màn hình PC khác. Có hai phiên bản của GIF: GIF87 và GIF89. Các khác biệt thì
đủ nhỏ để gần như tất cả các chương trình đọc được GIF thì có thể đọc được cả hai
dạng tốt như nhau. GIF được chuẩn hoá tốt, nên bạn không gặp vấn đề các file viết
bởi chương trình này chương trình khác không đọc được.
Hàng tá các chương trình thương mại và chia sẻ (shareware) trên PC và Mac
có thể đọc và ghi các file GIF. Trên UNIX, trong hệ Windows X, chỉ có ít chương
trình miễn phí và shareware, có lẽ chương trình được dùng nhiều nhất trong số đó
là ImageMagick và XV. Bạn có thể tìm thấy chúng trong các archive
comp.sources.x của USENET, chẳng hạn như ở wuarchive trong thư mục
/usenet/comp.sources.x. (Tất cả đều ở dạng nguồn, nên phải biết biên dịch C để cài
đặt chúng. Kiếm mấy viên kẹo sôcôla và lựa lời đường mật dụ các chuyên gia chỗ
bạn làm dùm).
Cặp mắt có nó
Quay lại vài năm trước, một nhóm chuyên gia hình chụp số đã ngồi lại với
nhau và quyết định rằng: A). đã đến lúc cần có một dạng thức chuẩn chính thức
cho các hình ảnh số hoá, và B). không có dạng thức nào hiện có là đủ tốt. Họ thành
lập Nhóm Liên kết Chuyên gia Hình ảnh - JPEG (Joint Photography Experts
Group), và sau một vòng đàm phán mở rộng, dạng thức JPEG ra đời. JPEG được
thiết kế chuyên để lưu trữ các hình ảnh số hoá, trắng đen hay đủ màu, chứ không
phải các hình ảnh hoạt hoạ của máy tính hay thứ gì khác. Kết quả là JPEG đã làm
tốt việc lưu trữ hình ảnh và làm kém việc lưu trữ những thứ khác.
Phiên bản JPEG của một tấm hình bằng khoảng 1/4 kích thước file GIF
9
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
tương ứng. (Thực tế file JPEG có thể có kích thước bất kỳ vì dạng thức này cho
phép cân nhắc giữa kích thước so với chất lượng khi file được tạo ra). Bất lợi chính
của JPEG là nó giải mã chậm đáng kể hơn so với GIF, nhưng các file cũng nhỏ hơn
nhiều nên cũng xứng đáng. Phần lớn các chương trình có thể hiển thị các file GIF
thì cũng xử lý được JPEG. Các file JPEG luôn có tên file tận cùng là .jpeg hay .jpg.
Đôi khi có người nói là các hình JPEG nhìn không đẹp như GIF. Đúng ra là
nếu bạn có một hình đủ màu và tạo ra một file GIF 256 màu rồi chuyển file GIF đó
ra file JPEG, nó nhìn không đẹp lắm. Tuy nhiên, để có chất lượng hình tốt nhất,
hãy đòi những file JPEG đủ màu.
Một chuyến đến rạp hát
Khi mạng trở nên nhanh hơn và đĩa lớn hơn, người ta bắt đầu cất cả một bộ
phim được số hoá (lúc này mới vẫn chỉ là những bộ phim ngắn). Dạng phim chuẩn
gọi là Nhóm Chuyên gia Hình Điện ảnh (MPEG - Moving Photographic Experts
Group) được thiết lập bởi một ủy ban dưới quyền ủy ban JPEG và - lần đầu tiên
trong lịch sử các nỗ lực định chuẩn - được lập ra nhờ dùng những kết quả của
JPEG.
Các chương trình xem hình của MPEG tìm thấy cùng chỗ của JPEG. Bạn
cần một trạm làm việc tương đối nhanh hoặc một PC thuộc loại mạnh dẫn đầu để
hiển thị các phim ảnh cho giống với thời gian thực.
Hãy để cho trăm dạng thức đua nở
Người ta còn dùng nhiều dạng thức file đồ hoạ khác, mặc dù GIF và JPEG là
hai dạng phổ biến nhất cho đến nay trên Internet. Các dạng khác mà bạn có thể
chạy bao gồm:
PCX: Đây là dạng DOS được dùng bởi nhiều chương trình vẽ - cũng
tốt cho những hình có độ phân giải thấp.
TIFF: Đây là một dạng đặc biệt phức tạp với hàng trăm lựa chọn -
nhiều đến nỗi một file TIFF viết bởi một chương trình chương trình khác không
đọc được.
TARGA: (Gọi là TGA trên PC). Đây là dạng chung nhất cho các hình
10
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
được quét (scan) vào. Trên các archive của Internet, TARGA bị hất cẳng bởi JPEG
gọn hơn nhiều.
PICT: Đây là một dạng thường gặp trên Macintosh vì Mac có hỗ trợ
nội lập (Built-in support) cho nó.
Một vài lời từ đội phó
Tôi cuộc là bạn đang thắc mắc không biết có archive trực tuyến nào chứa,
ờ , hình ảnh lai căng nhưng bạn hơi bối rối nên không hỏi. Vâng, tôi sẽ nói cho
bạn biết - Không. Không có gì trên các archive FTP công cộng chứa những thứ lôi
thôi ngoài các hình ảnh theo mốt như lấy từ Redbook hay Hoạ báo thể thao.
Có hai lý do. Một là chính trị. các công ty và các trường đại học tài trợ phần
lớn những vị trí trên Internet thì không thích bị cho là truyền bá văn hoá đồi trụy,
mà cũng không muốn làm đầy những đĩa chứa mắc tiền các hình ảnh không dùng
được trong những công việc hợp lệ. (ở một trường đại học, khi người ta lấy các
hình ảnh Playboy đi, họ đặt một thông điệp vào đó nói rằng nếu bạn có thể giải
thích tại sao bạn cần nó cho những nghiên cứu học tập của mình, họ sẽ trả nó lại
chỗ cũ).
Lý do kia là thực tế. Thỉnh thoảng có ai đó thu thập cho cá nhân anh ta (hầu
như luôn là anh ta) một bộ hình ảnh loại R và để trên một FTP vô danh. Chỉ trong
năm phút, hàng ngàn sinh viên mướt mồ hôi tay cố gắng FTP vào, và chỗ đó trên
Internet sẽ bị nghiền đến treo máy luôn. Sau năm phút nữa, để bảo toàn tính mạng,
các hình ảnh sẽ được lấy đi.
Á ! Tôi không thể FTP được !
Ồ không! Bạn chỉ có mối nối email với Internet, nên bạn không thể FTP
những thứ rõ là vớ vẩn này được! Đời không đáng để sống nữa.
Đợi một chút. Vẫn còn hy vọng. Nhiều máy chủ có tâm hồn cao thượng trên
Internet cho phép FTP qua dịch vụ email. Bạn email một yêu cầu đến đó, một robot
11
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
trợ giúp sẽ lấy file và gởi chúng đến cho bạn. Điều đó không đẹp như FTP trực tiếp
nhưng còn hơn không. Chỉ có một vài server FTP-bằng-thư là tồn tại, vậy hãy coi
đó là những tài nguyên quí giá. Đặc biệt, để ý những điều sau:
Nên yêu cầu có chừng mực. Khi nó gởi cho bạn một file phi văn bản
(nhớ rằng file nén hay lưu trữ là phi văn bản dành cho việc FTP, dù là chúng có thể
chứa văn bản), nó phải mã hoá theo kiểu văn bản làm cho các thông điệp gởi đi
35% lớn hơn chính file đó. vậy nếu bạn lấy một file 100K, bạn nhận được một thư
135K, là rất lớn đối với thư. Nếu bạn dùng một hệ thống thương mại mà phải trả
tiền cho thư gởi đến, bạn có thể thấy FTP bằng thư thật là mắc tiền. (Trong trường
hợp đó, thử dùng dịch vụ như AT&T Mail hay MCI Mail vốn không tính tiền thư
đến, hoặc một nhà cung cấp Internet công cộng cho phép truy xuất FTP trực tiếp).
Hãy kiên nhẫn, gần như tất cả hệ thống FTP-bằng-thư phân chia khẩu
phần cho dịch vụ của chúng. Điều này có nghĩa là nếu nhiều người cùng sử dụng
chúng (luôn là như vậy), có thể bị chậm lại nhiều ngày đến khi nó nhận được yêu
cầu của bạn. Nếu bạn gởi một yêu cầu đi mà không nghe phản hồi ngay, đừng gởi
nó lần nữa.
Trước khi bạn dùng một server FTP-bằng-thư có mục đích phục vụ
tổng quát, kiểm tra xem nếu hệ thống mà bạn muốn lấy gì từ đó có có hay không
một server của riêng nó để gởi các file cho bạn chỉ từ hệ thống đó. Nếu có thì dùng
nó vì nó nhanh hơn nhiều so với server tổng quát kia.
Server FTP-bằng-thư thông dụng nhất là BITFTP. Đầu tiên là nó hướng đến
những người sử dụng BITNET, một mạng cũ, đa phần là IBM, có các dịch vụ thư
lớn nhưng không có FTP. ở Mỹ có một server BITFTP ở Đại học Princeton là
bitftp@pucc.princeton.edu. Những người sử dụng ở châu Âu nên thử
bitftp@vm.gmd.de ở Đức.
Trước khi bạn gởi yêu cầu nào đến server FTP-bằng-thư, gởi một thông điệp
trực tuyến chứa từ help. Bạn nên làm điều này vì hai lý do: để xem thông điệp giúp
đỡ có chứa điều gì thú vị không và kiểm tra là bạn và server có thể gởi thông điệp
cho nhau. Đừng cố lấy file nào cho đến khi bạn nhận được thông điệp giúp đỡ.
12
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Thông điệp mà bạn gởi đến một server BITFTP không ít thì nhiều là một
chuỗi các lệnh mà bạn muốn công bố trong một phiên làm việc FTP tương tác. Ví
dụ để lấy một file văn bản với chỉ mục các ghi chú FYI từ INTERNIC (INTERnet
Network Information Center - Trung tâm thông tin mạng Internet) ở
ftp.internic.net, gởi thông điệp sau đây đến BITFTP:
FTP ftp.internic.net
USER anonymous
cd fyi
get fyi-index.txt
quit
Bạn có thể nhập vào nhiều lệnh cd và get nếu cần, nhưng phải nhớ là bạn
không muốn làm đầy hộp thư của mình với vô số thông điệp gởi đến chứa đầy các
file.
Làm sao tôi biết yêu cầu file nào đây?
Một câu hỏi tuyệt vời. Tôi rất mừng là bạn đã hỏi. Nếu bạn gặp may, sẽ có ai
đó gởi cho bạn một lưu ý nên tìm cái gì. Nếu không được vậy, bạn liệt kê thư mục
và đòi một file trong một yêu cầu sau này, như sau:
FTP ftp.internic.net
USER anonymous
cd fyi
dir
quit
Nhiều hệ thống có sẵn một danh sách thư mục đầy đủ trong một file ở đầu
mức thư mục. File luôn được gọi tên như ls-IR hay ls-IR.Z. (Những cái tên lục cục
này xuất phát từ những lệnh UNIX dùng để tạo ra chúng). Nếu có một file như thế
tồn tại, cố lấy nó thay vì là làm hàng ngàn tỉ lệnh dir. Nếu không có lr-IR, nhưng có
file REAME, lấy file này vì nó thường nói cho bạn biết file chứa liệt kê thư mục
được dấu ở đâu.
If u cn rd ths u mst b a cmptr
13
Website: http://www.docs.vn Email : lienhe@docs.vn Tel (: 0918.775.368
Nếu bạn có thể đọc những dòng này, bạn hẳn phải là một cái máy tính.
Đến nay chúng ta đã xem xét việc lấy các file văn bản bằng thư. Nhưng còn
khoảng 96% các file còn lại không phải văn bản thì sao? Đối với những file đó có
một công cụ khác gọi là uuencode. (Tôi đã nói điều này trong chương 11, bởi vì
cách làm cũng giống như gởi file nhị phân như tin tức của USENET). Chương trình
uuencode hoá trang file nhị phân như văn bản, giống như sau:
begin plug.exe 644
M390GNM4L -REP3PT45G00I -05[I5 - 6M3OME,MRMK760PI5LPTMET
LMKPYMEOT39I4905B05YOPV30IXKRTịKWLJROJTOU,6P5;3;MRUO5
OI4J5OI4
end
bạn phải đưa nó vào chương trình uudecode để lấy lại file ban đầu. Nếu file
thật sự lớn, bản đã được uuencode của nó sẽ gởi đi như nhiều thông điệp thư từ, mà
bạn phải cất tất cả các thông điệp theo cùng thứ tự vào một file rồi uuencode file
đó.
Để lấy một file nhị phân, bạn cho uuencode một từ khoá trên dòng lệnh FTP
để nó uuencode những gì nó đã lấy và, như thường lệ, cho một lệnh binary để bảo
nó FTP file ở chế độ nhị phân. Ví dụ, để lấy danh sách thư mục đã được nén từ
/INFO trên wuarchive.wustl.edu, gởi đến BITFTP như sau:
FTP wuarchive.wustl.edu uuencode
USER anonymous
binary
cd info
get ls-lR.Z
quit
Sau khi bạn đã uuencode file này, bạn giải nén nó (giống như một file bạn đã
FTP trực tiếp) để có danh sách file.
Nếu bạn không có một bản trình uudecode sẵn đó nhưng thật sự có quyền
14
Không có nhận xét nào:
Đăng nhận xét