Web-scale collections are considerably larger than the AP89 collection translation - Web-scale collections are considerably larger than the AP89 collection Thai how to say

Web-scale collections are considera

Web-scale collections are considerably larger than the AP89 collection.
The AP89 collection contains about 40 million words, but the (relatively small)TREC Web collection GOV26 contains more than 20 billion words.
With that many words, it seems likely that the number of new words would eventually drop to near zero and Heaps’ law would not be applicable.
It turns out this is not the case.
Figure 4.4 shows a plot of vocabulary growth for GOV2 together with a graph of Heaps’ law with k = 7.34 and β = 0.648. This data indicates that the number of unique words continues to grow steadily even after reaching 30 million.
This has significant implications for the design of search engines, which will be discussed in Chapter 5.
Heaps’ law provides a good fit for this data, although the parameter values are very different than those for other TREC collections and outside the boundaries established as typical with these and other smaller collections.

0/5000
From: -
To: -
Results (Thai) 1: [Copy]
Copied!
คอลเลกชันของเว็บขนาดจะใหญ่กว่าคอลเลกชัน AP89 คอลเลกชัน AP89 ประกอบด้วยคำประมาณ 40 ล้าน แต่การเก็บรวบรวมเว็บ TREC (ค่อนข้างเล็ก) GOV26 ประกอบด้วยมากกว่า 20 พันล้านคำ กับที่ หลายคำ เหมือนมีแนวโน้มว่า จำนวนคำใหม่ในที่สุดจะลดลงใกล้ศูนย์ และจะไม่บังคับใช้กฎหมายของกอง ปรากฎว่าไม่เป็นกรณีนี้รูปที่ 4.4 แสดงพล็อตศัพท์โตของ GOV2 ร่วมกับกราฟของกองกฎหมายด้วย k = 7.34 และβ = 0.648 ข้อมูลนี้บ่งชี้ว่า จำนวนคำเฉพาะยังคงเติบโตอย่างต่อเนื่องแม้หลังจากถึง 30 ล้าน นี้มีนัยสำคัญสำหรับการออกแบบของเครื่องมือค้นหา ซึ่งจะกล่าวถึงในบทที่ 5 ของกองกฎหมายให้เหมาะสมสำหรับข้อมูลนี้ ถึงแม้ว่าค่าพารามิเตอร์มีความแตกต่างกว่า สำหรับคอลเลกชันอื่น ๆ TREC และ นอกขอบเขตที่เป็นทั่วไปเหล่านี้และคอลเลกชันขนาดเล็กอื่น ๆ
Being translated, please wait..
Results (Thai) 2:[Copy]
Copied!
คอลเลกชันเว็บขนาดมีมากมีขนาดใหญ่กว่าคอลเลกชัน AP89 ได้.
คอลเลกชัน AP89 มีประมาณ 40 ล้านคำ แต่ (ค่อนข้างเล็ก) TREC คอลเลกชันเว็บ GOV26 มีมากกว่า 20 พันล้านคำ.
กับที่หลายคำมันดูเหมือนว่าจำนวนของ คำศัพท์ใหม่ในที่สุดก็จะลดลงไปอยู่ใกล้ศูนย์และกอง 'กฎหมายจะไม่สามารถใช้งานได้.
มันจะเปิดออกนี้ไม่ได้เป็นกรณี.
รูปที่ 4.4 แสดงให้เห็นว่าพล็อตของการเจริญเติบโตคำศัพท์สำหรับการ GOV2 ร่วมกับกราฟของกอง' การกฎหมายที่มี K = 7.34 และβ = 0.648 ข้อมูลนี้จะแสดงให้เห็นว่าจำนวนของคำที่ไม่ซ้ำกันยังคงเติบโตอย่างต่อเนื่องแม้กระทั่งหลังจากที่ไปถึง 30 ล้าน.
นี้มีผลกระทบอย่างมีนัยสำคัญสำหรับการออกแบบของเครื่องมือค้นหาซึ่งจะมีการหารือในบทที่ 5
กฎหมายกอง 'ให้เป็นแบบที่ดีสำหรับข้อมูลนี้แม้ว่า ค่าพารามิเตอร์ที่มีความแตกต่างกว่าที่คอลเลกชัน TREC อื่น ๆ และนอกขอบเขตที่จัดตั้งขึ้นเป็นปกติด้วยเหล่านี้และคอลเลกชันขนาดเล็กอื่น ๆ

Being translated, please wait..
 
Other languages
The translation tool support: Afrikaans, Albanian, Amharic, Arabic, Armenian, Azerbaijani, Basque, Belarusian, Bengali, Bosnian, Bulgarian, Catalan, Cebuano, Chichewa, Chinese, Chinese Traditional, Corsican, Croatian, Czech, Danish, Detect language, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Frisian, Galician, Georgian, German, Greek, Gujarati, Haitian Creole, Hausa, Hawaiian, Hebrew, Hindi, Hmong, Hungarian, Icelandic, Igbo, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Luxembourgish, Macedonian, Malagasy, Malay, Malayalam, Maltese, Maori, Marathi, Mongolian, Myanmar (Burmese), Nepali, Norwegian, Odia (Oriya), Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Samoan, Scots Gaelic, Serbian, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tajik, Tamil, Tatar, Telugu, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uyghur, Uzbek, Vietnamese, Welsh, Xhosa, Yiddish, Yoruba, Zulu, Language translation.

Copyright ©2025 I Love Translation. All reserved.

E-mail: