Reuters-RCV1has 100million tokens.

Reuters-RCV1has 100million tokens. Collecting alltermID–docIDpairsof the collection using 4 bytes each for termID and docID therefore requires 0.8 GB of storage. Typical collections today are often one or two orders of mag- nitude larger than Reuters-RCV1. You can easily see how such collections overwhelm even large computers if we try to sort their termID–docID pairs in memory. If the size of the intermediate ﬁles during index construction is within a small factor of available memory, then the compression techniques introduced in Chapter 5 can help; however, the postings ﬁle of many large collections cannot ﬁt into memory even after compression.

0/5000

From: -

To: -

Results (Thai) 1: [Copy]

Copied!

รอยเตอร์ RCV1has 100million โทเค็น รวบรวม alltermID–docIDpairsof คอลเลกชันโดยใช้ 4 ไบต์สำหรับ termID และ docID ดังนั้นต้องเก็บ 0.8 GB คอลเลกชันทั่วไปวันนี้มักสั่งหนึ่ง หรือสองของมัก nitude ใหญ่กว่ารอยเตอร์ส-RCV1 ง่าย ๆ คุณสามารถดูว่าชุดดังกล่าวล้นแม้ขนาดใหญ่คอมพิวเตอร์ถ้าเราพยายามเรียงคู่ของพวกเขา termID–docID ในหน่วยความจำ ถ้าขนาดของ ﬁles กลางระหว่างก่อสร้างดัชนีเป็นตัวเล็กหน่วยความจำ แล้วเทคนิคการบีบอัดที่แนะนำในบทที่ 5 สามารถช่วย อย่างไรก็ตาม ﬁle ลงในคอลเลกชันขนาดใหญ่ไม่สามารถ ﬁt ลงในหน่วยความจำแม้หลังจากบีบอัด

Being translated, please wait..

Results (Thai) 2:[Copy]

Copied!

สำนักข่าวรอยเตอร์-RCV1has 100million สัญญาณ เก็บ alltermID-docIDpairsof เก็บโดยใช้ 4 ไบต์แต่ละ termID และ docID จึงต้อง 0.8 GB ของการจัดเก็บ คอลเลกชันโดยทั่วไปในวันนี้มักจะเป็นหนึ่งหรือสองคำสั่งของแม็ก-nitude มีขนาดใหญ่กว่ารอยเตอร์-RCV1 คุณสามารถดูวิธีการที่คอลเลกชันดังกล่าวครอบงำแม้เครื่องคอมพิวเตอร์ขนาดใหญ่ถ้าเราพยายามที่จะเรียงลำดับคู่ termID-docID ของพวกเขาในหน่วยความจำ ถ้าขนาดของไฟล์กลางในระหว่างการก่อสร้างอยู่ในดัชนีปัจจัยเล็ก ๆ ของหน่วยความจำที่มีอยู่แล้วเทคนิคการบีบอัดที่รู้จักในบทที่ 5 สามารถช่วย แต่ไฟล์การโพสต์ของคอลเลกชันขนาดใหญ่จำนวนมากไม่สามารถใส่ลงไปในหน่วยความจำแม้หลังจากการบีบอัด

Being translated, please wait..

Results (Thai) 3:[Copy]

Copied!

reuters-rcv1has 100million สัญญาณ รวบรวม alltermid – docidpairsof คอลเลกชันโดยใช้ 4 ไบต์แต่ละสำหรับและดังนั้นจึงต้องมี termid docid 0.8 GB ของการจัดเก็บ คอลเลกชันทั่วไปวันนี้มักจะมีหนึ่งหรือสองสั่งแม็ก - nitude ขนาดใหญ่กว่า reuters-rcv1 . คุณสามารถดูคอลเลกชันต่อคอมพิวเตอร์ขนาดใหญ่ เช่น ถ้าเราพยายามที่จะจัดเรียง termid – docid คู่ของพวกเขาในหน่วยความจำถ้าขนาดของกลางจึงเล ในระหว่างการก่อสร้างดัชนีภายในปัจจัยเล็ก ๆของหน่วยความจำแล้วอัดเทคนิคที่แนะนำในบทที่ 5 ช่วย อย่างไรก็ตาม การโพสต์จึงเลอของคอลเลกชันขนาดใหญ่มากไม่สามารถถ่ายทอด t ในความแม้หลังจากการบีบอัด

Being translated, please wait..

Other languages

The translation tool support: Afrikaans, Albanian, Amharic, Arabic, Armenian, Azerbaijani, Basque, Belarusian, Bengali, Bosnian, Bulgarian, Catalan, Cebuano, Chichewa, Chinese, Chinese Traditional, Corsican, Croatian, Czech, Danish, Detect language, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Frisian, Galician, Georgian, German, Greek, Gujarati, Haitian Creole, Hausa, Hawaiian, Hebrew, Hindi, Hmong, Hungarian, Icelandic, Igbo, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Luxembourgish, Macedonian, Malagasy, Malay, Malayalam, Maltese, Maori, Marathi, Mongolian, Myanmar (Burmese), Nepali, Norwegian, Odia (Oriya), Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Samoan, Scots Gaelic, Serbian, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tajik, Tamil, Tatar, Telugu, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uyghur, Uzbek, Vietnamese, Welsh, Xhosa, Yiddish, Yoruba, Zulu, Language translation.