20.3.3.2 Coverage
Coverage refers to the number of target user - target item pairs for which a prediction can be generated. A classical way to measure the coverage of a recommender system is by using the leave-one-out method, which consists of hiding a rating and trying to predict its hidden value. The coverage of a specific algorithm then refers to the amount of computable predictions pa,i versus the number of leave-one-out experiments to perform (i.e., the number of ratings available in the data set). For Formula (20.3) we call pa,i computable if there is at least one user u for which the PCC wa,u can be calculated, while for Formulas (20.1) and (20.4) a computable pa,i means that there is at least one user u for which the (propagated) trust estimate ta,u can be calculated. Finally, for Formula (20.5), predictions are possible when at least one user u is found for which the PCC can be computed and ta,u is 1.
Table 20.3 shows the coverage (% COV) for controversial items (CIs) and randomly selected items (RIs) in Guha’s and Massa’s data sets. The first four rows cover baseline strategies (B1)–(B4). The first baseline strategy is a system that always predicts 5/5 (B1), since this is the predominant score for items in Epinions. The second system computes the average received rating for the target item (B2), while the third one yields the average rating given by target user a (B3). The latter method will score well in a system where the users have a rating behaviour with little variation. Finally, the last baseline returns a random helpfulness score between 1 and 5 (B4).
In general, baselines (B1), (B2) and (B4) achieve maximal coverage for both controversial and randomly selected items: (B1) and (B4) do not rely on any additional (trust or PCC) information, and since the items in our experiments are evaluated at least 20 times, it is always possible to compute (B2). With (B3), in those cases in which the target user rated only one item, his average rating is lacking, so a prediction cannot be generated.
For the other algorithms in Table 20.3, the numbers in the first column refer to the corresponding recommendation formulas given above. For the trust-enhanced approaches, we distinguish between experiments that did not use propagated trust information (higher rows) and those that did (bottom rows). We only consider onestep propagation: for (P1) and (P4), we maintained the propagation strategy used in TidalTrust and MoleTrust8 respectively, while for (P5) we added a user to RT if he belongs to theWOT of the target user a, or is directly trusted by a WOT member of a. Without propagation, it is clear that the coverage of the collaborative filtering algorithm is superior to that of the others, and approaches the maximal value. This is due to the fact that PCC information is, in general, more readily available than direct trust information: there are normally more users for which a positive correlation with the target user a can be computed than users in a’s WOT. On the other hand, trust-based filtering (20.5), which also uses PCC weights, is the most demanding strategy because it requires users in a’s WOT who have already rated two other
Results (
Thai) 1:
[Copy]Copied!
20.3.3.2 ความครอบคลุมความครอบคลุมอ้างถึงหมายเลขของผู้ใช้ปลายทาง - คู่สินค้าเป้าหมายที่คุณสามารถสร้างการคาดการณ์ วิธีคลาสสิกในการวัดความครอบคลุมของระบบผู้แนะนำโดยวิธีลาออกหนึ่ง ซึ่งประกอบด้วยการซ่อนการจัดอันดับ และพยายามที่จะทำนายค่าซ่อน อยู่ ความครอบคลุมของอัลกอริทึมเฉพาะแล้วอ้างถึงจำนวนคาดคะเน computable ป่า ฉันเทียบลาออกหนึ่งทดลองทำ (เช่น หมายเลขในชุดข้อมูลจัดอันดับ) สำหรับสูตร (20.3) เราเรียกป่า ฉัน computable ถ้ามีน้อยผู้ใช้ u ที่ PCC wa คุณสามารถคำนวณ ในขณะที่สำหรับสูตร (20.1) และ(ยัง 20.4) ป่า computable ฉันหมายความ ว่า มีน้อยผู้ใช้ u ที่น่าเชื่อถือ (เผยแพร่) ประเมินตา คุณสามารถคำนวณได้ ในที่สุด สูตร (20.5), คาดคะเนเป็นไปได้ u อยู่ที่ PCC ที่สามารถถูกคำนวณ และตา u คือ 120.3 ตารางแสดงความครอบคลุม (% COV) สำหรับแย้ง (CIs) และสุ่มเลือกสินค้า (RIs) ในชุดข้อมูลของ Guha และของมาซซา แถวแรก 4 ครอบคลุมกลยุทธ์พื้นฐาน (B1)–(B4) กลยุทธ์หลักแรกเป็นระบบที่จะทำนาย 5/5 (B1), เนื่องจากเป็นการให้คะแนนกันสำหรับสินค้าใน Epinions ระบบที่สองจะได้รับคะแนนเฉลี่ยสำหรับสินค้าเป้าหมาย (B2), ในขณะที่คนที่สามทำให้คะแนนเฉลี่ยที่กำหนด โดยผู้ใช้เป้าหมาย (B3) วิธีหลังจะทำคะแนนดีในระบบที่ผู้ใช้มีพฤติกรรมจัดอันดับ มีการเปลี่ยนแปลงเล็กน้อย สุดท้าย หลักสุดท้ายส่งกลับคะแนนงามสุ่มระหว่าง 1 ถึง 5 (B4)ในทั่วไป เส้น (B1), (B2) และ (B4) ให้ความคุ้มครองสูงสุดสำหรับสินค้าที่เลือกแบบสุ่ม และแย้ง: (B1) และ (B4) อาศัยการเพิ่มเติมใด ๆ (ความน่าเชื่อถือหรือ PCC) ข้อมูล และเนื่องจากในการทดลองของเราจะประเมินอย่างน้อย 20 ครั้ง เสมอสามารถคำนวณ (B2) ด้วย (B3), ในกรณีที่ผู้ใช้เป้าหมายอันดับหนึ่งเท่านั้น คะแนนเฉลี่ยของเขาขาด จึงไม่สามารถสร้างการคาดการณ์สำหรับอื่น ๆ อัลกอริทึมในตาราง 20.3 ตัวเลขในคอลัมน์แรกที่อ้างอิงถึงสูตรคำแนะนำที่เกี่ยวข้องที่ให้ไว้ข้างต้น สำหรับวิธีเพิ่มความน่าเชื่อถือ เราแยกความแตกต่างระหว่างการทดลองที่ไม่ใช้ความน่าเชื่อถือที่เผยแพร่ข้อมูล (แถวสูง) และที่ไม่ได้ (แถวล่าง) เราพิจารณาเฉพาะการแพร่กระจาย onestep: สำหรับ (P1) และ (P4), เรารักษาเผยแพร่กลยุทธ์ที่ใช้ใน TidalTrust และ MoleTrust8 ตามลำดับ ในขณะที่สำหรับ (P5) เราเพิ่มผู้ใช้ RT หากเขาอยู่ใน theWOT ของผู้ใช้เป้าหมายการ หรือตรงใจ โดยสมาชิก WOT ของ โดยไม่มีการเผยแพร่ เป็นที่ชัดเจนว่า ความครอบคลุมของอัลกอริทึมกรองร่วมกันเหนือกว่าของผู้อื่น และใกล้ถึงค่าสูงสุด นี่คือเนื่องจากข้อเท็จจริงที่ว่าข้อมูล PCC เป็น ทั่วไป ยิ่งพร้อมกว่าข้อมูลความน่าเชื่อถือตรง: มีผู้ใช้มากกว่าปกติซึ่งความสัมพันธ์ในเชิงบวกกับผู้ใช้ปลายทางสามารถถูกคำนวณมากกว่าผู้ใช้ในแบบของ WOT บนมืออื่น ๆ ความน่าเชื่อถือกรอง (20.5), ซึ่งใช้ PCC น้ำหนัก เป็นกลยุทธ์ความต้องการมากที่สุดเนื่องจากต้องการผู้ใช้ในแบบของ WOT ที่มีแล้วอันดับสองอื่น ๆ
Being translated, please wait..

Results (
Thai) 3:
[Copy]Copied!
20.3.3.2 ครอบคลุม
ครอบคลุมหมายถึงจำนวนของผู้ใช้เป้าหมาย - คู่รายการเป้าหมายที่คาดการณ์ได้อย่างมีประสิทธิภาพ เป็นวิธีที่คลาสสิกที่จะวัดความครอบคลุมของระบบแนะนำโดยใช้วิธีให้คนหนึ่งออกไป ซึ่งประกอบด้วยซ่อนคะแนนและพยายามที่จะคาดเดาของที่ซ่อนอยู่ค่า ความครอบคลุมของขั้นตอนวิธีการเฉพาะเจาะจงแล้ว หมายถึง ปริมาณของคำนวณคาดคะเน ปาผมเทียบกับจำนวนหนึ่งออกมาจากการทดลองปฏิบัติ ( เช่น จำนวนของคะแนนที่มีอยู่ในชุดข้อมูล ) สำหรับสูตร ( 20.3% ) เราเรียกป้า ผมคำนวณว่ามีอย่างน้อยหนึ่งผู้ใช้ u ที่ PCC วา คุณสามารถคำนวณ ในขณะที่สูตร ( 20.1% ) และ ( 20.4 ) โดยคำนวณ ผมหมายถึงว่ามีอย่างน้อยหนึ่งผู้ใช้ U ซึ่ง ( ขยายพันธุ์ ) เชื่อกะทา คุณสามารถคำนวณ .สำหรับสูตร ( 20.5 ) การคาดการณ์เป็นไปได้เมื่อคุณพบอย่างน้อยหนึ่งผู้ใช้ที่ PCC สามารถคำนวณและตา , U คือ 1 .
ตาราง 20.3 แสดงความครอบคลุม ( % ปิด ) สำหรับรายการขัดแย้ง ( CIS ) และรายการที่เลือกโดยการสุ่ม ( RIS ) ใน guha และชุดมาคือ ข้อมูล สี่แถวแรกครอบคลุมกลยุทธ์พื้นฐาน ( 1 ) – ( B4 )กลยุทธ์พื้นฐานแรกคือ ระบบที่มักจะคาดการณ์ 5 / 5 ( B1 ) , ตั้งแต่นี้เป็นคะแนนที่เหนือกว่าสินค้าใน epinions . ระบบที่สองคำนวณเฉลี่ยได้รับคะแนนสำหรับรายการเป้าหมาย ( B2 ) ในขณะที่สามหนึ่งให้ค่าคะแนนเฉลี่ยที่ได้รับจากผู้ใช้เป้าหมาย ( B3 ) วิธีหลังจะได้คะแนนดีในระบบที่ผู้ใช้มีพฤติกรรมที่ประเมินด้วยการเปลี่ยนแปลงเล็ก ๆน้อย ๆสุดท้าย ( สุดท้าย ) สุ่มความเอื้ออาทรระหว่าง 1 และ 5 คะแนน ( B4 )
โดยทั่วไปเส้น ( B1 ) , ( 2 ) และ ( B4 ) ให้ความคุ้มครองสูงสุดสำหรับทั้งแย้งและการสุ่มเลือกรายการ : ( B1 ) และ ( B4 ) ไม่พึ่งพาใด ๆเพิ่มเติม ( เชื่อหรือ PCC ) ข้อมูล และเนื่องจากรายการในการทดลองของเรามีการประเมินอย่างน้อย 20 ครั้ง มันเป็นไปได้ที่จะคำนวณ ( B2 ) ( B3 )ในคดีที่ผู้ใช้เป้าหมายสูงสุดเพียงหนึ่งรายการเรตติ้งเฉลี่ยของเขาขาด ดังนั้นการทำนายไม่สามารถสร้าง
สำหรับอัลกอริทึมอื่น ๆ ในโต๊ะ 20.3 , ตัวเลขในคอลัมน์แรกดูที่แนะนำสูตรที่ระบุข้างต้น สำหรับความไว้วางใจเพิ่มแนวเราแยกแยะระหว่างการทดลองที่ไม่ได้ใช้ทั้งข้อมูลเชื่อถือได้ ( แถวสูงกว่า ) และผู้ที่ไม่ได้ ( แถวล่าง ) เราพิจารณาผลงานการขยายพันธุ์ : ( P1 ) และ ( P4 ) , เรายังคงใช้กลยุทธ์ที่ใช้ใน tidaltrust และ moletrust8 ตามลำดับ ส่วนใน ( P5 ) เราเพิ่มผู้ใช้ RT ถ้าเขาเป็นของ thewot ของผู้ใช้เป้าหมาย ,หรือได้รับโดยตรงจากสมาชิกของ ไม่มีการโหวด มันชัดเจนว่า ความครอบคลุมของขั้นตอนวิธีการกรองร่วมกันเป็นกว่าของผู้อื่น วิธีมูลค่าสูงสุด นี้เกิดจากข้อเท็จจริงที่ว่าข้อมูล PCC คือโดยทั่วไปมากขึ้นพร้อมใช้งานกว่าข้อมูลที่เชื่อถือโดยตรง :มีผู้ใช้ปกติมากขึ้นซึ่งมีความสัมพันธ์ทางบวกกับเป้าหมายที่ผู้ใช้สามารถคำนวณมากกว่าผู้ใช้ในก็คือ . บนมืออื่น ๆที่ไว้วางใจใช้กรอง ( 20.5 ) ซึ่งยังใช้ PCC น้ำหนัก มีความต้องการมากที่สุด เพราะมันต้องใช้กลยุทธ์ในก็คือที่ได้อันดับสองอื่น ๆ
Being translated, please wait..
