We became interested in these emergent search communities because we believed that there was a high likelihood that similarities would exist between the search patterns of community members. For example, Figure 18.2 presents the results of a recent 17-week study of the search patterns for 70 employees of a local software company; this study preceded the trial discussed later in this paper. During the study we examined more than 20,000 individual search queries and almost 16,000 result selections. We see that, on average, just over 65% of queries submitted shared at least 50% (> 0.5 similarity threshold) of their query terms with at least 5 other queries; and more than 90% of queries shared at least 25% of their terms with about 25 other queries. In other words, searchers within this ad hoc corporate search community do search for similar things in similar ways, much more so than in generic search scenarios where we typically find much lower repetition rates of about 10% at the 0.5 similarity threshold [92].
This is an important result which is supported by similar studies on other communities of searchers [92], and which motivates our collaborative web search approach. It tells us that, in the context of communities of like-minded searchers, the world of web search is a repetitive and regular place. A type of community search knowledge is generated from the search experiences of individuals as they search. This in turn suggests that it may be possible to harness this search knowledge by facilitating the sharing of search experiences among community members. So, as a simple example, when a visitor to the previously mentioned wildlife portal searches for “jaguar pictures” they can be recommended search results that have been previously selected by other community members for similar queries. These results will likely relate to the wildlife interests of the community and so, without any expensive processing of result content, we can personalize search results according to the learned preferences of the community. In this way, novice searchers can benefit from the shared knowledge of more experienced searchers.
18.4.2 The Collaborative Web Search System
Figure 18.3 presents the basic architecture for our collaborative web search system, which is designed to work alongside an underlying mainstream search engine — in this case, Google. Briefly, a proxy-based approach is adopted to intercept queries on their way to the underlying search engine, and to manipulate the results that are returned from this engine back to the searcher. In this way users get to use their favourite search engine in the normal way, but with collaborative web search (CWS) promotions incorporated into the result-lists directly via the proxy. For example, consider a user Ui submitting query qT to Google. This request is redirected to the CWS system whereupon two things happen. First, the query is passed on to Google and the result-list RS is returned in the normal way. Second, in parallel the query is also used to access a local store of the search activity forUi?s community – the CWS hit-matrix – to generate a ranked set of promotion candidates, RP, as outlined below. These promotion candidates are annotated by the explanation engine to present the searcher with a graphical representation of their community history. Result-lists RP and RS are merged and the resulting list Rf inal is returned to the user; typically this merge involves promoting the k (e.g., k = 3) most relevant promotions to the head of the result-list.
Thus for a target search query, CWS combines a default result-list, RS, from a standard search engine, with a set of recommended (promoted) results, RP, drawn from the community’s past search history. To do this the search histories of a given community, C, of users (C = {U1, ...,Un}) are stored in a hit-matrix, HC, such that each row corresponds to some query qi and each column to some selected result page pj. The value stored in HC i j refers to the number of times that page pj has been selected for query qi by members of C. In this way, each hit-matrix acts as a repos
Results (
Thai) 2:
[Copy]Copied!
เรากลายเป็นที่สนใจในชุมชนค้นหาฉุกเฉินเหล่านี้เพราะเราเชื่อว่ามีโอกาสสูงที่จะคล้ายคลึงกันอยู่ระหว่างรูปแบบการค้นหาของสมาชิกในชุมชน ตัวอย่างเช่นรูปที่ 18.2 นำเสนอผลการศึกษา 17 สัปดาห์ที่ผ่านมาของรูปแบบการค้นหา 70 พนักงานของ บริษัท ซอฟต์แวร์ท้องถิ่น การศึกษาครั้งนี้นำหน้าการพิจารณาคดีกล่าวถึงในบทความนี้ ในระหว่างการศึกษาเราตรวจสอบมากกว่า 20,000 คำค้นหาบุคคลและเกือบ 16,000 ผลการเลือก เราจะเห็นว่าโดยเฉลี่ยเพียงกว่า 65% ของการค้นหาส่งที่ใช้ร่วมกันอย่างน้อย 50% (> 0.5 เกณฑ์ความคล้ายคลึงกัน) ของคำค้นหาของพวกเขาที่มีอย่างน้อย 5 คำสั่งอื่น ๆ และอื่น ๆ กว่า 90% ของคำสั่งที่ใช้ร่วมกันอย่างน้อย 25% ของข้อตกลงของพวกเขาที่มีประมาณ 25 คำสั่งอื่น ๆ ในคำอื่น ๆ ค้นหาภายในโฆษณานี้คณะกรรมการชุมชนค้นหาองค์กรจะค้นหาสิ่งที่คล้ายกันในรูปแบบที่คล้ายกันมากขึ้นดังนั้นกว่าในสถานการณ์การค้นหาทั่วไปที่เรามักจะพบอัตราการเกิดซ้ำที่ต่ำกว่ามากประมาณ 10% ในเกณฑ์คล้ายคลึงกัน 0.5 [92] นี้เป็นผลสำคัญที่ได้รับการสนับสนุนโดยการศึกษาที่คล้ายกันในชุมชนอื่น ๆ ของผู้ค้นหา [92] และที่กระตุ้นวิธีการค้นหาเว็บการทำงานร่วมกันของเรา มันบอกเราว่าในบริบทของชุมชนของผู้ค้นหาที่มีใจเดียวกันโลกของการค้นหาเว็บเป็นสถานที่ซ้ำ ๆ และปกติ ประเภทของการค้นหาความรู้กับชุมชนถูกสร้างขึ้นจากประสบการณ์การค้นหาของบุคคลที่พวกเขาค้นหา นี้ในการเปิดแสดงให้เห็นว่ามันอาจจะเป็นไปได้ที่จะใช้ประโยชน์จากความรู้การค้นหานี้โดยการอำนวยความสะดวกในการแบ่งปันประสบการณ์การค้นหาในหมู่สมาชิกในชุมชน เพื่อให้เป็นตัวอย่างง่ายๆเมื่อผู้เข้าชมการค้นหาพอร์ทัลสัตว์ป่ากล่าวก่อนหน้านี้สำหรับ "ภาพจากัวร์" ที่พวกเขาสามารถได้รับการแนะนำผลการค้นหาที่ได้รับการคัดเลือกก่อนหน้านี้โดยสมาชิกในชุมชนอื่น ๆ สำหรับคำสั่งที่คล้ายกัน ผลลัพธ์เหล่านี้มีแนวโน้มที่จะเกี่ยวข้องกับผลประโยชน์ของสัตว์ป่าของชุมชนและอื่น ๆ โดยไม่ต้องมีการประมวลผลที่มีราคาแพงของเนื้อหาผลให้เราสามารถปรับแต่งผลการค้นหาตามการตั้งค่าการเรียนรู้ของชุมชน ด้วยวิธีนี้ผู้ค้นหาสามเณรจะได้รับประโยชน์จากความรู้ที่ใช้ร่วมกันของผู้ค้นหาประสบการณ์มากขึ้น. 18.4.2 ระบบค้นหาเว็บร่วมมือรูปที่ 18.3 นำเสนอสถาปัตยกรรมพื้นฐานสำหรับระบบการค้นหาเว็บของเราทำงานร่วมกันซึ่งถูกออกแบบมาเพื่อทำงานร่วมกับเครื่องมือค้นหาหลักพื้นฐาน - ในกรณีนี้ Google สั้น ๆ , วิธีการที่ใช้พร็อกซี่ถูกนำมาใช้เพื่อสกัดกั้นคำสั่งเกี่ยวกับวิธีการของพวกเขาเพื่อเครื่องมือค้นหาพื้นฐานและการจัดการกับผลที่ได้รับกลับมาจากเครื่องยนต์รุ่นนี้กลับไปที่ค้นหา ในผู้ใช้วิธีนี้ได้รับการใช้เครื่องมือค้นหาของพวกเขาที่ชื่นชอบในวิธีปกติ แต่มีการทำงานร่วมกันค้นหาเว็บ (CWS) โปรโมชั่นรวมอยู่ในรายการผลโดยตรงผ่านพร็อกซี่ ตัวอย่างเช่นพิจารณาใช้ QT อุ้ยส่งแบบสอบถามไปยัง Google คำขอนี้จะถูกนำไปยังระบบ CWS ครั้นแล้วสองสิ่งที่เกิดขึ้น ครั้งแรกที่แบบสอบถามจะส่งผ่านไปยัง Google และอาร์เอสผลรายการจะถูกส่งกลับตามปกติ ประการที่สองในขนานแบบสอบถามจะใช้ในการเข้าถึงยังร้านค้าในพื้นที่ของกิจกรรมการค้นหา forUi ชุมชน - CWS ตีแมทริกซ์ - เพื่อสร้างชุดการจัดอันดับของผู้สมัครโปรโมชั่นอาร์พีที่ระบุไว้ด้านล่าง ผู้สมัครโปรโมชั่นเหล่านี้จะมีคำอธิบายประกอบคำอธิบายโดยเครื่องมือค้นหาที่จะนำเสนอที่มีการแสดงกราฟิกของประวัติศาสตร์ชุมชนของพวกเขา RP ผลรายการและอาร์เอสมีการควบรวมกิจการและรายการผลลัพธ์ Rf Inal จะถูกส่งกลับไปยังผู้ใช้; มักจะผสานนี้เกี่ยวข้องกับการส่งเสริม k (เช่น k = 3) โปรโมชั่นที่เกี่ยวข้องมากที่สุดที่หัวของผลรายการ. ดังนั้นสำหรับการค้นหาเป้าหมาย CWS รวมเริ่มต้นผลรายการอาร์เอสจากเครื่องมือค้นหามาตรฐานด้วย ชุดของที่แนะนำ (การเลื่อนตำแหน่ง) ผล RP มาจากประวัติการค้นหาที่ผ่านมาของชุมชน การทำเช่นนี้ประวัติการค้นหาของชุมชนที่ได้รับ, C, ของผู้ใช้ (C = {U1, ... , Un}) ถูกเก็บไว้ในตีแมทริกซ์, HC เช่นว่าแต่ละแถวสอดคล้องกับบางฉีแบบสอบถามและแต่ละคอลัมน์ บางหน้าผลการเลือก PJ ค่าที่เก็บไว้ใน HC เจหมายถึงจำนวนครั้งที่ PJ หน้าเว็บที่ได้รับเลือกสำหรับฉีแบบสอบถามโดยสมาชิกของซีด้วยวิธีนี้แต่ละคนทำหน้าที่ตีแมทริกซ์เป็น Repos
Being translated, please wait..

Results (
Thai) 3:
[Copy]Copied!
เราก็สนใจในเรื่องเหล่านี้ เพราะเราเชื่อว่าการค้นหาชุมชนซึ่งมีความเป็นไปได้สูงที่คล้ายคลึงกันจะอยู่ระหว่างการค้นหารูปแบบของสมาชิกชุมชน ตัวอย่างเช่น รูปยังแสดงผลล่าสุด 17 สัปดาห์การศึกษารูปแบบการค้นหาของ บริษัท ซอฟต์แวร์ในประเทศ 70 คน การศึกษานี้นำคดีกล่าวถึงต่อไปในบทความนี้ระหว่างเรียน เราตรวจสอบมากกว่า 20 , 000 ค้นหาบุคคลค้นหาและเลือกเกือบ 16 , 000 ผล เราพบว่า โดยเฉลี่ยเพียงกว่า 65% ของแบบสอบถามแสดงความคิดเห็นร่วมกันอย่างน้อย 50% ( > 0.5 ความเหมือนธรณีประตู ) ของข้อตกลงการค้นหาของพวกเขาอย่างน้อย 5 แบบสอบถามอื่น และมากกว่า 90% ของแบบสอบถามที่ใช้ร่วมกันอย่างน้อย 25% ของข้อตกลงของพวกเขาเกี่ยวกับ 25 แบบสอบถามอื่น ๆ ในคำอื่น ๆค้นหาภายในชุมชนองค์กรเฉพาะกิจการค้นหาสิ่งที่คล้ายกันในวิธีที่คล้ายกันมากขึ้นดังนั้นกว่าในทั่วไปค้นหาสถานการณ์ที่เรามักจะพบที่ต่ำกว่าอัตราการทำซ้ำประมาณ 10 % ที่ 0.5 ความเหมือนธรณีประตู [ 92 ]
นี่เป็นสำคัญ ผลที่ได้รับการสนับสนุนโดยการศึกษาที่คล้ายกันในชุมชนอื่น ๆค้นหา [ 92 ]ซึ่งกระตุ้นของเราร่วมกันและการค้นหาเว็บวิธีการ มันบอกเราว่า ในบริบทของชุมชนของผู้ค้นหาเหมือนกัน โลกของการค้นหาเว็บเป็นซ้ำและสถานที่ทั่วไป ประเภทของความรู้ที่ถูกสร้างขึ้นจากการค้นหาชุมชนค้นหาประสบการณ์ของบุคคลที่พวกเขาค้นหานี้ในการเปิดแสดงให้เห็นว่ามันเป็นไปได้ที่จะใช้ความรู้นี้โดยการส่งเสริมการแลกเปลี่ยนประสบการณ์การค้นหาของสมาชิกชุมชน ดังนั้น ตัวอย่างง่าย ๆเมื่อผู้เข้าชมที่กล่าวถึงก่อนหน้านี้สัตว์ป่าพอร์ทัลค้นหา " จากัวร์ภาพ " ที่พวกเขาสามารถแนะนำผลการค้นหาที่ได้เลือกไว้ก่อนหน้านี้ โดยสมาชิกในชุมชนอื่น ๆสำหรับการค้นหาที่คล้ายกันผลลัพธ์เหล่านี้อาจจะเกี่ยวข้องกับผลประโยชน์ของชุมชนและสัตว์ป่า ดังนั้น โดยไม่ต้องดำเนินการใด ๆราคาแพงของปริมาณผล เราสามารถปรับแต่งผลการค้นหาตามเพื่อเรียนรู้ความต้องการของชุมชน ในวิธีนี้ค้นหาสามเณรสามารถได้รับประโยชน์จากการแบ่งปันความรู้ประสบการณ์เพิ่มเติมค้นหา .
18.4.2 ความร่วมมือระบบค้นหาเว็บ
รูปที่ 183 นำเสนอสถาปัตยกรรมพื้นฐานของเราร่วมกัน ค้นหาเว็บ ระบบ ซึ่งถูกออกแบบมาเพื่อทำงานร่วมกับการปรับเปลี่ยนหลักเครื่องมือค้นหา -- ในกรณีนี้ , Google สั้น ๆ , วิธีการใช้พร็อกซี่เป็นลูกบุญธรรมเพื่อสกัดกั้นแบบสอบถามทางต้นแบบเครื่องมือค้นหา และจัดการกับผลลัพธ์ที่ส่งกลับจากเครื่องยนต์นี้กลับไปค้นหา .ในวิธีนี้ผู้ใช้สามารถใช้เครื่องมือค้นหาที่ชื่นชอบของพวกเขาในทางที่ธรรมดา แต่ด้วยความร่วมมือเว็บค้นหา ( CWS ) โปรโมชั่นรวมอยู่ในผลรายชื่อได้โดยตรงผ่านทางพร็อกซี ตัวอย่างเช่นพิจารณาส่งแบบสอบถามผู้ใช้ UI ที่ Google คำสั่งนี้จะเปลี่ยนเส้นทางไปยัง CWS ระบบซึ่งสองสิ่งเกิดขึ้น ครั้งแรกแบบสอบถามจะถูกส่งผ่านไปยัง Google และผลรายการอาร์เอสกลับมาในทางปกติ ประการที่สอง และแบบสอบถาม นอกจากนี้ยังใช้ในการเข้าถึงร้านท้องถิ่นของกิจกรรมการค้นหา forui ? ของชุมชน ( CWS ตีเมทริกซ์–การจัดลำดับผู้สมัครการ RP ตามที่อธิบายไว้ด้านล่างผู้สมัครโปรโมชั่นเหล่านี้มีบันทึกย่อโดยการอธิบาย นำเสนอ ค้นหาเครื่องยนต์ ด้วยการเป็นตัวแทนของประวัติศาสตร์ชุมชนของพวกเขา ผลการสัมมนารายการและ RS จะผสาน และส่งผลให้ inal รายการ RF จะถูกส่งกลับไปยังผู้ใช้ โดยทั่วไป นี้เกี่ยวข้องกับการส่งเสริม เช่น ผสาน K , K = 3 ) โปรโมชั่นที่เกี่ยวข้องมากที่สุดกับหัวของรายการผลลัพธ์
ดังนั้นสำหรับเป้าหมายการค้นหาสอบถามกับ CWS รวมเริ่มต้นผลรายการ , RS , จากเครื่องมือค้นหามาตรฐาน ด้วยการตั้งค่าที่แนะนำ ( ส่งเสริม ) RP ผล ได้มาจากค้นหาประวัติความเป็นมาของชุมชนในอดีต ทำ ค้นหาประวัติของชุมชนให้ ซี ของผู้ใช้ ( C = { U1 , . . . , a } ) จะถูกเก็บไว้ในเมทริกซ์ ตีทุก ซึ่งแต่ละแถวจะสอดคล้องกับบางแบบสอบถามฉีและแต่ละคอลัมน์จะคัดเลือกบางผลหน้าเกตค่าเก็บไว้ใน HC . หมายถึงจำนวนครั้งที่ PJ หน้าได้รับเลือกสำหรับการฉี โดยสมาชิกของ C . ในวิธีนี้ , การตีแต่ละเมทริกซ์ทำหน้าที่เป็นเรพ
Being translated, please wait..
