Fig. 18.1: Functional components of a typical web search engine. A page, pi , is located on the web by the crawler and its content, the terms t1,...,tn, are retrieved and indexed as part of an offline process. In response to a search query, the engine probes the index to retrieve results which match the query terms, pi,..., pj, which are then ranked by their relevance according to the search engines particular ranking metrics, before being presented to the searcher as a result-list.
Improving the ranking of search results became the challenge for these early search engines and even the race for the largest search index took a back seat in the face of this more pressing need. It soon became clear, however, that relying solely on the terms in a page was not going to be sufficient, no matter how much time was invested in tweaking these early ranking algorithms. Simply put, there were lots of pages that scored equally well when it came to counting matching query and page terms, but few of these pages turned out to be truly relevant and authoritative. Although term matching information had a role to play in overall relevance, on its own it was insufficient, and it was clear that there was vital information missing from the ranking process.
The missing ingredient came about as a result of research undertaken by a number of groups during the mid 1990’s. This included the work of John Kleinberg [40] and, most famously, the work of Google founders Larry Page and Sergey Brin [13].
Results (
Thai) 3:
[Copy]Copied!
รูปที่ 18.1 : ชิ้นส่วนการทำงานของเว็บทั่วไป เครื่องมือค้นหา หน้า , พี , ตั้งอยู่บนเว็บ โดยรวบรวมข้อมูลและเนื้อหาของข้อตกลง T1 , . . . , TN , ดึงและดัชนีเป็นส่วนหนึ่งของกระบวนการแบบออฟไลน์ . ในการตอบสนองต่อการค้นหา เครื่องยนต์ใช้ดัชนีเพื่อดึงผลลัพธ์ที่ตรงกับคำถามแง่ , PI , PJ . . . . .ซึ่งจะเรียงตามความเกี่ยวข้องของพวกเขาตามเครื่องมือค้นหาการจัดอันดับโดยวัดก่อนที่จะถูกนำเสนอให้กับผู้ค้นหาที่รายการผล
การปรับปรุงอันดับของผลการค้นหาได้กลายเป็นความท้าทายสำหรับเครื่องมือค้นหาต้นเหล่านี้ และแม้การแข่งขันในดัชนีการค้นหาที่ใหญ่ที่สุด เอาเบาะหลังในหน้านี้ต้องกดมากขึ้น . มันเร็ว ๆนี้กลายเป็นที่ชัดเจน อย่างไรก็ตามที่อาศัย แต่เพียงผู้เดียวในเงื่อนไขในหน้า ไม่เพียงพอ ไม่ว่าเท่าใดเวลาที่ได้ลงทุนในการปรับเปลี่ยนเหล่านี้ก่อนการจัดอันดับอัลกอริธึม ใส่เพียงแค่มีจำนวนมากของหน้าเว็บที่ได้คะแนนเท่ากันดีเมื่อมันมาถึงนับตรงกับแบบสอบถามและหน้าข้อตกลง แต่ไม่กี่ของหน้าเว็บเหล่านี้กลับกลายเป็นอย่างแท้จริงที่เกี่ยวข้องและเผด็จการแม้ว่าในระยะข้อมูลการจับคู่มีบทบาทในการเล่นในความเกี่ยวข้องโดยรวมในตัวของมันเอง มันไม่เพียงพอ และมันเป็นที่ชัดเจนว่ามีข้อมูลสำคัญที่ขาดหายไปจากกระบวนการจัดอันดับ
หายไปส่วนผสมมาเกี่ยวกับผลของการวิจัยที่ดำเนินการโดยหลายกลุ่มในช่วงกลางทศวรรษ 1990 นี้รวมผลงานของจอห์น ไคลน์เบิร์ก [ 40 ] และชื่อเสียงมากที่สุด , ,การทำงานของ Google Sergey Brin และ Larry Page ผู้ก่อตั้ง [ 13 ]
Being translated, please wait..
