Results (
Vietnamese) 2:
[Copy]Copied!
3.2.10 WIC-Thu thập phần chính
• Phân phối đơn vị Crawler - Các đơn vị Crawler là các thành phần thực sự truy cập web và thu thập dữ liệu. Một giải pháp thu thập có thể bao gồm một hoặc nhiều đơn vị Crawler dựa trên số tiền yêu cầu thu và số lượng dự kiến của dữ liệu. Mỗi đơn vị bộ sưu tập yêu cầu nhiệm vụ từ Bộ sưu tập Manager. Một khi nhiệm vụ được nhận, mỗi đơn vị Bộ sưu tập hoạt động độc lập, thu thập dữ liệu, bình thường hóa nó, chạy một kiểm tra chống virus và đi qua nó trở lại trung tâm lưu trữ. Thêm đơn vị Crawler đến một giải pháp làm việc hiện tại là đơn giản và không đòi hỏi bất kỳ thời gian chết của hệ thống. Một đơn vị Crawler có thể truy cập web bằng các phương pháp khác nhau: thu thập thông trực tiếp, proxy, proxy chuyên dụng, và TOR
Being translated, please wait..
