where P(a∩b∩c)is the joint probability, or the probability that all three words occur in a document, andP(a),P(b), andP(c)are the probabilities of each word occurring in a document.
A search engine will always have access to the number of documents that a word occurs in (fa, fb, and fc),7
and the number of documents in the collection (N), so these probabilities can easily be estimated as P(a) = fa/N, P(b) = fb/N, and P(c) = fc/N.
This gives us
Results (
Thai) 1:
[Copy]Copied!
โดยที่ P (a∩b∩c) คือ ความน่าเป็นร่วม หรือความเป็นไปได้ว่า ทั้งสามคำที่เกิดขึ้นในเอกสาร andP(a),P(b), andP (c) อยู่น่าจะของแต่ละคำที่เกิดขึ้นในเอกสาร เครื่องมือค้นหาจะเสมอสามารถเข้าถึงหมายเลขของเอกสารที่ว่า คำที่เกิดขึ้นใน (fa, fb และ fc), 7และจำนวนของเอกสารในชุด (N), เพื่อให้เหล่านี้น่าจะได้ความเป็น P(a) = fa N, P(b) = fb/N และ P(c) = fc/N. นี้ทำให้เรา
Being translated, please wait..
