where f (r,u) and f (r, t) correspond to the co-occurrence counts between resources and users, and resources and tags respectively. Here ? is a predefined weight balancing the influence of each model. The usual Expectation-Maximization (EM) algorithm is then applied for performing maximum likelihood estimation for the model. Resources for a given user u are then weighted by the probability P(r|u) (see Eq. 19.7), ranked, and the top ranked resources are finally recommended. For recommending users, one can either recommend a neighborhood based on ?UTY or ?URY. In order to recommend a neighborhood that takes into account the three modes of the folksonomy, one could, for example, either use the matrix extensions proposed by [37] (see Figure 19.7) or compute a linear combination of the user similarities based on the user-resource and user-tag projection matrices.
Remarks on Complexity CF usually suffers from scalability problems, given that the whole input matrix needs to be kept in memory. In STS, one may have to eventually keep more than one matrix in memory, depending on which kind of projections one wants to operate upon. To compute recommendations we usually need three steps:
1. Computation of projections: In order to compose the projections, we need to determine the (u, r), (u, t) and/or (r, t) co-occurrences. For that, we just need to do a linear scan in Y.
2. Neighborhood computation: In traditional user-based CF algorithms, the computation of the neighborhood Nu is usually linear on the number of users as one needs to compute the similarity of a given test user with all the other users in the database. In addition, we need to sort the similarities in order to determine the k-nearest neighbors.
3. Recommendations: For predicting the top-n tag/resource recommendations for a given test user, we need to: (i) count the tags/resources co-occurrences with the nearest neighbors Nu, (ii) weight each co-occurrence by the corresponding
19.4.2 Recommendation based on Ranking
In the following we present recommendation algorithms that, inspired from Web ranking, base their recommendations on a ranking score. Their common characteristic is that the score is computed according to spectral attributes extracted from the underlying folksonomy data structure. However, the different ways to represent a folksonomy (see Section 19.2.1) can result in different ranking-based algorithms. 19.4.2.1 Ranking based on Tensor Factorization By representing Y as a tensor, one is able to exploit the underlying latent semantic structure in A formed by multi-way correlations between users, tags, and resources. This can be attained using recommendation algorithms that are based on tensor factorization, as the ones proposed in [26, 35, 43]. With such algorithms, multi-way correlations can be effectively detected, leading to improved performance. Chapter 5 presents several state-of-the-art methods for matrix factorization (i.e., second-order tensor factorization) for the problem of rating prediction.
The factorization of A is expressed as follows (see Figure 19.8):
Results (
Thai) 1:
[Copy]Copied!
ซึ่ง f (r, u) และ f (r, t) สอดคล้องกับเหตุการณ์ร่วมไว้ระหว่างทรัพยากร และผู้ ใช้ และทรัพยากร และแท็กตามลำดับ ที่นี่ มีน้ำหนักล่วงหน้าสมดุลอิทธิพลของแต่ละรุ่น อัลกอริทึม Maximization ความคาดหวัง (EM) ปกติใช้สำหรับการดำเนินการประเมินความเป็นไปได้สูงสุดสำหรับรูปแบบแล้ว ทรัพยากรสำหรับผู้ใช้กำหนดคุณแล้วถ่วงน้ำหนักตามความน่าเป็น P(r|u) (ดู Eq. 19.7), จัดอันดับ และทรัพยากรในการจัดอันดับด้านบนก็แนะนำ สำหรับแนะนำผู้ใช้ หนึ่งอาจสามารถแนะนำย่านตาม UTY หรือ URY เพื่อแนะนำย่านที่จะพิจารณาในสามโหมดของโฟล์กโซโนมี หนึ่งสามารถ เช่น ใช้ส่วนขยายของเมตริกซ์ที่เสนอ โดย [37] (ดูรูปที่ 19.7) หรือคำนวณการรวมเชิงเส้นของความเหมือนผู้ที่ตามเมทริกซ์ฉายผู้ใช้ทรัพยากรและผู้ใช้แท็กได้ หมายเหตุใน CF ความซับซ้อนมักจะ suffers จากปัญหาภาระ ที่ทั้งหมดป้อนเมทริกซ์ต้องถูกเก็บไว้ในหน่วยความจำ ใน STS หนึ่งอาจต้องเก็บเมตริกซ์หนึ่งในหน่วยความจำ ขึ้นอยู่กับชนิดของประมาณหนึ่งอยากมีเมื่อในที่สุด การคำนวณคำแนะนำที่เรามักจะจำเป็นสามขั้นตอน:1. คำนวณประมาณ: เขียนประมาณนี้ เราต้องกำหนดแบบ (u, r), (u, t) / (r, t) เกิดร่วม ที่ เราเพียงแค่ทำการสแกนแบบเชิงเส้นใน Y2. ย่านคำนวณ: ในแบบดั้งเดิมโดยผู้ใช้ CF อัลกอริทึม การคำนวณย่านนูเป็นเส้นปกติจำนวนผู้ใช้ต้องคำนวณเฉพาะผู้ทดสอบให้กับทั้งหมดที่ผู้ใช้อื่นในฐานข้อมูล นอกจากนี้ เราต้องเรียงลำดับที่ความเหมือนเพื่อกำหนด k ใกล้บ้าน3. คำแนะนำ: สำหรับคำแนะนำด้านบน n แท็ก/ทรัพยากรสำหรับผู้ทดสอบกำหนดคาดการณ์ เราจำเป็นต้อง: (i) นับป้าย/ทรัพยากรร่วมกับเพื่อนบ้านที่ใกล้ที่สุด Nu (ii) แต่ละเหตุการณ์ร่วมน้ำหนัก โดยให้สอดคล้องกับ 19.4.2 แนะนำตามการจัดอันดับในต่อไปนี้เรานำอัลกอริทึมคำแนะนำที่ แรงบันดาลใจจากการจัดอันดับเว็บ พื้นฐานของคำแนะนำในการจัดอันดับคะแนน ลักษณะทั่วไปของพวกเขาจะมีคำนวณคะแนนตามคุณลักษณะสเปกตรัมที่สกัดจากต้นแบบโฟล์กโซโนมีโครงสร้างข้อมูล อย่างไรก็ตาม วิธีแสดงแบบโฟล์กโซโนมี (ดูหัวข้อ 19.2.1) สามารถทำให้กระบวนการจัดอันดับแตกต่างกันได้ 19.4.2.1 จัดอันดับตาม Tensor แยกตัวประกอบโดยแทน Y เป็น tensor หนึ่งสามารถใช้โครงสร้างความหมายแฝงอยู่ในต้นใน A ที่เกิดขึ้นจากหลายวิธีการความสัมพันธ์ระหว่างผู้ใช้ แท็ก และทรัพยากร นี้สามารถเป็นได้โดยใช้อัลกอริทึมคำแนะนำที่ขึ้นอยู่กับการแยกตัวประกอบ tensor เป็นคนเสนอใน [26, 35, 43] ด้วยเช่นอัลกอริทึม สัมพันธ์หลายวิธีสามารถได้อย่างมีประสิทธิภาพตรวจจับ นำไปสู่การปรับปรุงประสิทธิภาพ บทที่ 5 นำเสนอวิธีการต่าง ๆ ทันสมัยสำหรับเมทริกซ์การแยกตัวประกอบ (เช่น tensor ลำดับที่สองการแยกตัวประกอบ) สำหรับปัญหาของการคาดการณ์การจัดอันดับการแยกตัวประกอบของ A จะแสดงได้ดังนี้ (ดูรูปที่ 19.8):
Being translated, please wait..
Results (
Thai) 2:
[Copy]Copied!
ที่ f (R, มึง) และ f (R, t) สอดคล้องกับจำนวนผู้ร่วมเกิดขึ้นระหว่างทรัพยากรและผู้ใช้และทรัพยากรและแท็กตามลำดับ ที่นี่? เป็นน้ำหนักที่กำหนดไว้ล่วงหน้าสมดุลอิทธิพลของแต่ละรุ่น ปกติที่คาดว่า-ปรับปรุงสูงสุด (EM) อัลกอริทึมที่ใช้แล้วสำหรับการดำเนินการประมาณค่าความน่าจะเป็นสูงสุดสำหรับรูปแบบ ทรัพยากรสำหรับผู้ใช้ที่ระบุยูมีน้ำหนักแล้วโดยน่าจะเป็น P (R | ยู) (. เห็นสม 19.7) การจัดอันดับและทรัพยากรการจัดอันดับด้านบนในที่สุดก็มีการแนะนำ แนะนำสำหรับผู้ใช้หนึ่งสามารถแนะนำพื้นที่ใกล้เคียงอยู่บนพื้นฐานของ? UTY หรือ? URY เพื่อที่จะแนะนำพื้นที่ใกล้เคียงที่คำนึงถึงสามรูปแบบของ folksonomy ใครจะยกตัวอย่างเช่นอาจใช้นามสกุลเมทริกซ์ที่เสนอโดย [37] (ดูรูปที่ 19.7) หรือคำนวณรวมกันเชิงเส้นของความคล้ายคลึงกันของผู้ใช้บนพื้นฐานของ ใช้ทรัพยากรและการใช้แท็กการฝึกอบรมการฉาย. ข้อสังเกตเกี่ยวกับความซับซ้อน CF มักจะทนทุกข์ทรมานจากปัญหาความยืดหยุ่นให้ที่อินพุทเมทริกซ์ทั้งต้องเก็บไว้ในหน่วยความจำ ในเอสทีหนึ่งอาจจะต้องในที่สุดก็ให้มากกว่าหนึ่งเมทริกซ์ในหน่วยความจำซึ่งขึ้นอยู่กับชนิดของประมาณการใครต้องการที่จะดำเนินการตาม คำแนะนำในการคำนวณเรามักจะต้องสามขั้นตอน: 1 คำนวณประมาณการ: เพื่อประกอบการคาดการณ์ที่เราจำเป็นต้องตรวจสอบ (U, R) (มึง t) และ / หรือ (R, t) ที่เกิดขึ้นร่วมกัน เพื่อที่เราเพียงแค่ต้องทำสแกนเชิงเส้นในวาย2 พื้นที่ใกล้เคียงการคำนวณในการใช้งานตามขั้นตอนวิธีการแบบดั้งเดิม CF, คำนวณย่านนูมักจะเป็นเส้นตรงกับจำนวนผู้ใช้เป็นหนึ่งในความต้องการที่จะคำนวณความคล้ายคลึงกันของผู้ใช้ทดสอบให้กับผู้ใช้อื่น ๆ ในฐานข้อมูล นอกจากนี้เราจำเป็นต้องเรียงลำดับความคล้ายคลึงกันเพื่อตรวจสอบเพื่อนบ้านใกล้ที่สุด k. 3 คำแนะนำ: สำหรับการคาดการณ์แท็กบน n / คำแนะนำทรัพยากรสำหรับผู้ใช้ทดสอบให้เราต้อง: (i) นับแท็ก / ทรัพยากรที่เกิดขึ้นร่วมกับเพื่อนบ้านที่ใกล้ที่สุด Nu (ii) น้ำหนักแต่ละร่วมเกิดขึ้นโดยที่สอดคล้องกัน19.4.2 คำแนะนำบนพื้นฐานของการจัดอันดับในต่อไปนี้เราจะนำเสนอขั้นตอนวิธีการข้อเสนอแนะที่ได้แรงบันดาลใจจากการจัดอันดับเว็บฐานคำแนะนำของพวกเขาในการจัดอันดับคะแนน ลักษณะทั่วไปของพวกเขาคือว่าคะแนนจะคำนวณตามคุณลักษณะสเปกตรัมสกัดจากโครงสร้างข้อมูลพื้นฐาน folksonomy อย่างไรก็ตามวิธีการต่าง ๆ ที่จะเป็นตัวแทน folksonomy (ดูมาตรา 19.2.1) จะส่งผลในการจัดอันดับตามขั้นตอนวิธีการที่แตกต่างกัน 19.4.2.1 การจัดอันดับขึ้นอยู่กับ Tensor ตัวประกอบโดยตัวแทน Y เป็นเมตริกซ์หนึ่งคือสามารถใช้ประโยชน์จากโครงสร้างพื้นฐานความหมายแฝงอยู่ในความสัมพันธ์ที่เกิดขึ้นจากหลายทางระหว่างผู้ใช้แท็กและทรัพยากร นี้สามารถบรรลุโดยใช้กลไกข้อเสนอแนะที่เป็นไปตามตีนเป็ดเมตริกซ์เป็นคนที่นำเสนอใน [26, 35, 43] ด้วยขั้นตอนวิธีการดังกล่าวมีความสัมพันธ์หลายวิธีที่สามารถตรวจพบได้อย่างมีประสิทธิภาพนำไปสู่ประสิทธิภาพที่เพิ่มขึ้น . บทที่ 5 นำเสนอวิธีการหลายรัฐของศิลปะสำหรับเมทริกซ์ตีนเป็ด (เช่นเมตริกซ์ที่สองเพื่อตีนเป็ด) สำหรับปัญหาของการทำนายคะแนนของตีนเป็ดจะแสดงดังต่อไปนี้ (ดูรูปที่ 19.8)
Being translated, please wait..
Results (
Thai) 3:
[Copy]Copied!
โดยที่ f ( r , u ) f ( R , T ) สอดคล้องกับการนับระหว่างทรัพยากรและผู้ใช้ และทรัพยากร และแท็ก ตามลำดับ ที่นี่ คือ กำหนดน้ำหนักความสมดุลอิทธิพลของนางแบบแต่ละคน มีความคาดหวังปกติ ( เอ็ม ) โดยจะใช้สำหรับการประมาณความน่าจะเป็นสูงสุดสำหรับรูปแบบทรัพยากรสำหรับให้ผู้ใช้ u จะถ่วงน้ำหนักโดยความน่าจะเป็น P ( r | u ) ( เห็นอีคิว 19.7 ) , การจัดอันดับและอันดับแหล่งสุดท้ายที่แนะนำ เพื่อแนะนำผู้ใช้หนึ่งสามารถแนะนำเพื่อนบ้านตาม ? นะหรือ ? ยูรี่ . เพื่อที่จะแนะนำคนที่จะพิจารณาสามโหมดของโฟล์คโซโนมี หนึ่งได้ตัวอย่างเช่นให้ใช้นามสกุลเสนอโดยเมทริกซ์ [ 37 ] ( ดูรูปที่ 19.7 ) หรือคำนวณการรวมกันเชิงเส้นของผู้ใช้เหมือนกันขึ้นอยู่กับผู้ใช้ทรัพยากรและแท็กผู้ใช้เมทริกซ์ฉาย
ความเห็นที่ซับซ้อนมักจะทนทุกข์ทรมานจากปัญหาการทำงานโฆษณาให้ที่เมทริกซ์อินพุตทั้งหมดต้องถูกเก็บไว้ในความทรงจำ ในระบบหนึ่งอาจมีมากกว่าหนึ่งเมทริกซ์ในที่สุดเก็บในหน่วยความจำซึ่งขึ้นอยู่กับชนิดของแผนหนึ่งต้องการที่จะทำงานบน เพื่อหาข้อเสนอแนะ เรามักจะต้องการสามขั้นตอน :
1 การคำนวณประมาณการ : เพื่อสร้างประมาณการ เราต้องตรวจสอบ ( U , r ) ( U , t ) และ / หรือ ( R , T ) ร่วมเหตุการณ์ . ที่เราต้องทำเส้นสแกน y
2 การคำนวณในแบบดั้งเดิมที่ใช้ขั้นตอนวิธีการเพื่อนบ้านผู้ใช้โฆษณาการคำนวณของบ้านนู๋ มักจะเป็นเชิงเส้นบนหมายเลขของผู้ใช้เป็นหนึ่งต้องการคำนวณ ความเหมือนของแบบให้ผู้ใช้กับผู้ใช้ทุกคนอื่น ๆในฐานข้อมูล นอกจากนี้ เราต้องเรียงกันเพื่อตรวจสอบเพื่อนบ้านละ .
3 คำแนะนำ : ใช้ top-n แท็ก / ทรัพยากรที่แนะนำให้ผู้ใช้ทดสอบ เราต้องไปที่ :( ผม ) นับแท็ก / ทรัพยากรร่วมเกิดกับเพื่อนบ้านที่ใกล้ที่สุดตอนนี้ ( 2 ) น้ำหนักแต่ละการโดยตรงกัน
19.4.2 แนะนำตามการจัดอันดับ
ในเรานำเสนอคำแนะนำขั้นตอนวิธีตามแรงบันดาลใจจากการจัดอันดับของเว็บฐานข้อ คะแนนการจัดอันดับลักษณะทั่วไปของพวกเขาคือว่าคะแนนจะคำนวณตามการคุณลักษณะสกัดจากต้นแบบโฟล์คโซโนมีข้อมูลโครงสร้าง อย่างไรก็ตาม วิธีการต่างๆ ที่จะเป็นตัวแทนของโฟล์กโซโนมี ( ดูมาตรา 19.2.1 ) ได้ผลในการใช้ที่แตกต่างกัน อัลกอริทึม การจัดอันดับตาม 19.4.2.1 เมตริกซ์การแยกตัวประกอบโดยแสดงเป็นเมตริกซ์ Y ,หนึ่งสามารถใช้ประโยชน์จากพื้นฐานโครงสร้างในรูปแบบโดยแฝงความหมายหลายลักษณะความสัมพันธ์ระหว่างผู้ใช้ , แท็ก , และทรัพยากร นี้สามารถบรรลุการใช้คำแนะนำขั้นตอนวิธีที่อยู่บนพื้นฐานของเมตริกซ์การ เป็นคนเสนอใน [ 26 , 35 , 43 ] กับขั้นตอนวิธีดังกล่าว มีหลายวิธีที่สามารถตรวจพบได้อย่างมีประสิทธิภาพ นำไปสู่การปรับปรุงประสิทธิภาพ
Being translated, please wait..