Big data requires exceptional techn

Big data requires exceptional technologies to efficiently process large quantities of data within tolerable elapsed times. A 2011 McKinsey report[42] suggests suitable technologies include A/B testing, crowdsourcing, data fusion and integration, genetic algorithms, machine learning, natural language processing, signal processing, simulation, time series analysis and visualisation. Multidimensional big data can also be represented as tensors, which can be more efficiently handled by tensor-based computation,[43] such as multilinear subspace learning.[44] Additional technologies being applied to big data include massively parallel-processing (MPP) databases, search-based applications, data mining, distributed file systems, distributed databases, cloud-based infrastructure (applications, storage and computing resources) and the Internet.[citation needed]

Some but not all MPP relational databases have the ability to store and manage petabytes of data. Implicit is the ability to load, monitor, back up, and optimize the use of the large data tables in the RDBMS.[45]

DARPA’s Topological Data Analysis program seeks the fundamental structure of massive data sets and in 2008 the technology went public with the launch of a company called Ayasdi.[46]

The practitioners of big data analytics processes are generally hostile to slower shared storage,[47] preferring direct-attached storage (DAS) in its various forms from solid state drive (SSD) to high capacity SATA disk buried inside parallel processing nodes. The perception of shared storage architectures—Storage area network (SAN) and Network-attached storage (NAS) —is that they are relatively slow, complex, and expensive. These qualities are not consistent with big data analytics systems that thrive on system performance, commodity infrastructure, and low cost.

Real or near-real time information delivery is one of the defining characteristics of big data analytics. Latency is therefore avoided whenever and wherever possible. Data in memory is good—data on spinning disk at the other end of a FC SAN connection is not. The cost of a SAN at the scale needed for analytics applications is very much higher than other storage techniques.

There are advantages as well as disadvantages to shared storage in big data analytics, but big data analytics practitioners as of 2011 did not favour it.[48]

Some but not all MPP relational databases have the ability to store and manage petabytes of data. Implicit is the ability to load, monitor, back up, and optimize the use of the large data tables in the RDBMS.[45]

DARPA’s Topological Data Analysis program seeks the fundamental structure of massive data sets and in 2008 the technology went public with the launch of a company called Ayasdi.[46]

The practitioners of big data analytics processes are generally hostile to slower shared storage,[47] preferring direct-attached storage (DAS) in its various forms from solid state drive (SSD) to high capacity SATA disk buried inside parallel processing nodes. The perception of shared storage architectures—Storage area network (SAN) and Network-attached storage (NAS) —is that they are relatively slow, complex, and expensive. These qualities are not consistent with big data analytics systems that thrive on system performance, commodity infrastructure, and low cost.

Real or near-real time information delivery is one of the defining characteristics of big data analytics. Latency is therefore avoided whenever and wherever possible. Data in memory is good—data on spinning disk at the other end of a FC SAN connection is not. The cost of a SAN at the scale needed for analytics applications is very much higher than other storage techniques.

There are advantages as well as disadvantages to shared storage in big data analytics, but big data analytics practitioners as of 2011 did not favour it.[48]

0/5000

From: -

To: -

Results (Thai) 1: [Copy]

Copied!

ข้อมูลขนาดใหญ่จำเป็นต้องใช้เทคโนโลยีพิเศษมีประสิทธิภาพประมวลผลข้อมูลภายในเวลาผ่านไป tolerable จำนวนมาก ตัว 2011 แมคเคน [42] แนะนำเทคโนโลยีที่เหมาะสมรวม A / B ทดสอบ crowdsourcing ข้อมูลฟิวชั่นและรวม อัลกอริทึมทางพันธุกรรม เครื่องจักรการเรียนรู้ การประมวลผลภาษาธรรมชาติ การประมวลผลสัญญาณ การ จำลอง เวลาชุดวิเคราะห์และสร้างมโนภาพ นอกจากนี้ยังสามารถแสดงข้อมูลหลายมิติขนาดใหญ่เป็น tensors ซึ่งสามารถได้อย่างมีประสิทธิภาพจัดการ โดยการคำนวณตาม tensor, [43] เช่นเรียน multilinear subspace [44] เพิ่มเติมเทคโนโลยีที่ถูกนำไปใช้กับข้อมูลขนาดใหญ่ไว้อย่างหนาแน่นพร้อมกันการประมวลผลฐานข้อมูล (MPP) โปรแกรมประยุกต์ที่ใช้ค้นหา การทำเหมืองข้อมูล ระบบแฟ้มแบบกระจาย ฐานข้อมูลแบบกระจาย เมฆที่ใช้โครงสร้างพื้นฐาน (โปรแกรมประยุกต์ เก็บข้อมูล และคอมพิวเตอร์) และอินเทอร์เน็ต [ต้องการอ้างอิง]ความสามารถในการจัดเก็บ และจัดการ petabytes ข้อมูลบางส่วน แต่ไม่ทั้งหมดกลุ่มฐานข้อมูลเชิงสัมพันธ์ได้ สามารถโหลด ตรวจสอบ สำรองข้อมูล และการเพิ่มประสิทธิภาพการใช้ตารางข้อมูลขนาดใหญ่ใน RDBMS มีนัย [45]โปรแกรมวิเคราะห์ข้อมูล Topological ของ DARPA หาโครงสร้างพื้นฐานของชุดข้อมูลขนาดใหญ่ และในปี 2551 เทคโนโลยีไปสาธารณะ ด้วยการเปิดตัวของบริษัทที่เรียกว่า Ayasdi [46]ผู้ของกระบวนการวิเคราะห์ข้อมูลขนาดใหญ่โดยทั่วไปสู้กับช้าร่วมเก็บ, [47] พลุกพล่านตรงแนบเก็บ (DAS) ในรูปแบบต่าง ๆ จากสถานะของแข็ง (SSD) ดิสก์ SATA ความจุสูงที่ฝังอยู่ภายในโหนประมวลผลแบบขนานได้ การรับรู้ของสถาปัตยกรรมการจัดเก็บที่ใช้ร่วมกันซึ่งเครือข่ายพื้นที่เก็บข้อมูล (SAN) และเก็บบนเครือข่าย (NAS) — จะว่า จะค่อนข้างช้า ซับซ้อน และมีราคาแพง คุณสมบัติเหล่านี้ไม่สอดคล้องกับระบบวิเคราะห์ข้อมูลขนาดใหญ่ที่เจริญเติบโต ในประสิทธิภาพของระบบ โครงสร้างพื้นฐานสินค้า ต้นทุนต่ำจัดส่งข้อมูลเวลาจริง หรือใกล้จริงเป็นหนึ่งในการกำหนดลักษณะของการวิเคราะห์ข้อมูลขนาดใหญ่ แฝงอยู่จึงหลีกเลี่ยงทุกครั้ง และเป็นไป ข้อมูลในหน่วยความจำไม่ดี — ข้อมูลบนดิสก์ที่สุดของการเชื่อมต่อ FC ซานปั่นไม่ ต้นทุนของซานที่มาตราส่วนที่จำเป็นสำหรับโปรแกรมประยุกต์วิเคราะห์มากสูงกว่าเทคนิคอื่น ๆ จัดเก็บได้มีข้อดีกับข้อเสียการจัดเก็บที่ใช้ร่วมกันในการวิเคราะห์ข้อมูลขนาดใหญ่ แต่ผู้วิเคราะห์ข้อมูลขนาดใหญ่ 2554 ไม่โปรดปราน [48]

Being translated, please wait..

Results (Thai) 2:[Copy]

Copied!

ข้อมูลขนาดใหญ่ต้องใช้เทคโนโลยีที่โดดเด่นได้อย่างมีประสิทธิภาพในการประมวลผลข้อมูลจำนวนมากภายในเวลาที่ผ่านไปพอประมาณ รายงาน McKinsey 2011 [42] แสดงให้เห็นเทคโนโลยีที่เหมาะสมรวมถึงการทดสอบ A / B crowdsourcing ฟิวชั่นข้อมูลและบูรณาการขั้นตอนวิธีพันธุกรรม, การเรียนรู้เครื่องประมวลผลภาษาธรรมชาติ, การประมวลผลสัญญาณการจำลองการวิเคราะห์อนุกรมเวลาและการมองเห็น ข้อมูลขนาดใหญ่หลายมิตินอกจากนี้ยังสามารถแสดงเป็นเทนเซอร์ซึ่งสามารถจัดการได้อย่างมีประสิทธิภาพโดยการคำนวณเมตริกซ์ที่ใช้ [43] เช่นการเรียนรู้สเปซ multilinear. [44] เทคโนโลยีเพิ่มเติมที่จะถูกนำไปใช้กับข้อมูลขนาดใหญ่รวมถึงอย่างหนาแน่นขนานประมวลผล (เอ็มพีพี) ฐานข้อมูล การใช้งานการค้นหาที่ใช้การทำเหมืองข้อมูลการกระจายระบบไฟล์ฐานข้อมูลการกระจายโครงสร้างพื้นฐานของเมฆที่ใช้ (โปรแกรมจัดเก็บข้อมูลและทรัพยากรคอมพิวเตอร์) และอินเทอร์เน็ต. [อ้างจำเป็น] บางส่วน แต่ไม่ทั้งหมด MPP ฐานข้อมูลเชิงสัมพันธ์มีความสามารถในการจัดเก็บและการจัดการ เพตาไบต์ของข้อมูล นัยคือความสามารถในการโหลดตรวจสอบกลับขึ้นและเพิ่มประสิทธิภาพการใช้งานของตารางข้อมูลขนาดใหญ่ใน RDBMS ที่. [45] DARPA ของทอพอโลยีโปรแกรมวิเคราะห์ข้อมูลพยายามที่โครงสร้างพื้นฐานของชุดข้อมูลขนาดใหญ่และในปี 2008 เทคโนโลยีไปในที่สาธารณะด้วย การเปิดตัวของ บริษัท ที่เรียกว่า Ayasdi. [46] ผู้ปฏิบัติงานของกระบวนการวิเคราะห์ข้อมูลขนาดใหญ่โดยทั่วไปมักจะเป็นศัตรูกับการจัดเก็บข้อมูลที่ใช้ร่วมกันช้าลง [47] เลือกที่จัดเก็บโดยตรงแนบ (DAS) ในรูปแบบต่าง ๆ จากไดรฟ์ของรัฐที่มั่นคง (SSD) เพื่อความจุสูง ดิสก์ SATA ฝังอยู่ภายในโหนดประมวลผลแบบขนาน การรับรู้ของการจัดเก็บข้อมูลที่ใช้ร่วมกันสถาปัตยกรรมจัดเก็บเครือข่ายพื้นที่ (SAN) และการจัดเก็บข้อมูลที่แนบมาเครือข่าย (NAS) -is ว่าพวกเขาจะค่อนข้างช้าที่ซับซ้อนและมีราคาแพง คุณสมบัติเหล่านี้จะไม่สอดคล้องกับระบบการวิเคราะห์ข้อมูลขนาดใหญ่ที่เจริญเติบโตในการทำงานของระบบโครงสร้างพื้นฐานด้านสินค้าโภคภัณฑ์และต้นทุนต่ำ. จริงหรือเวลาใกล้จริงการส่งข้อมูลเป็นหนึ่งในการกำหนดลักษณะของการวิเคราะห์ข้อมูลขนาดใหญ่ แฝงจึงจะหลีกเลี่ยงและเมื่อใดก็ตามที่เป็นไปได้ ข้อมูลในหน่วยความจำข้อมูลที่ดีบนดิสก์หมุนที่ปลายอีกด้านของการเชื่อมต่อ FC SAN ไม่ ค่าใช้จ่ายของ SAN ในระดับที่จำเป็นสำหรับการใช้งานการวิเคราะห์เป็นอย่างมากสูงกว่าเทคนิคการเก็บข้อมูลอื่น ๆ . มีข้อได้เปรียบเช่นเดียวกับข้อเสียในการจัดเก็บข้อมูลที่ใช้ร่วมกันในการวิเคราะห์ข้อมูลขนาดใหญ่ แต่ผู้ปฏิบัติงานด้านการวิเคราะห์ข้อมูลขนาดใหญ่เป็นของปี 2011 ไม่เข้าข้างมัน. [ 48]

Being translated, please wait..

Results (Thai) 3:[Copy]

Copied!

ต้องใช้เทคโนโลยีพิเศษใหญ่ข้อมูลได้อย่างมีประสิทธิภาพกระบวนการปริมาณมากของข้อมูลภายในได้ผ่านไปครั้ง 2011 McKinsey รายงาน [ 42 ] แสดงให้เห็นเทคโนโลยีที่เหมาะสมรวมถึงทดสอบ A / B เตอร์ , ฟิวชั่นข้อมูลและบูรณาการ , การเรียนรู้เครื่องขั้นตอนวิธีพันธุกรรมการประมวลผล การประมวลผล การจำลองสัญญาณภาษาธรรมชาติ การวิเคราะห์อนุกรมเวลา และภาพ .ใหญ่ข้อมูลหลายมิติยังสามารถแสดงเป็นสั่ง ซึ่งสามารถจัดการได้อย่างมีประสิทธิภาพโดยเมตริกซ์การคำนวณตาม [ 43 ] เช่น ได้เรียนรู้ multilinear [ 44 ] เพิ่มเติมเทคโนโลยีถูกใช้กับการประมวลผลแบบขนานขนาดใหญ่รวมถึงข้อมูลอย่างหนาแน่น ( MPP ) ฐานข้อมูล , ค้นหาตามการใช้งานเหมืองข้อมูลแบบกระจาย ระบบแฟ้ม การกระจายฐานข้อมูลโครงสร้างพื้นฐานเมฆที่ใช้ ( โปรแกรม เก็บข้อมูล และทรัพยากรคอมพิวเตอร์และอินเทอร์เน็ต . [ อ้างอิงที่จำเป็น ]

บางส่วน แต่ไม่ทั้งหมด MPP ฐานข้อมูลเชิงสัมพันธ์มีความสามารถในการจัดเก็บและจัดการ petabytes ข้อมูล นัยคือความสามารถในการโหลดหน้าจอกลับขึ้นและเพิ่มประสิทธิภาพการใช้ขนาดใหญ่ของข้อมูลตารางในฐานข้อมูล [ 45 ]

โปรแกรมวิเคราะห์ข้อมูลรูปแบบและโครงสร้างพื้นฐานของ DARPA ของชุดข้อมูลขนาดใหญ่และในปี 2008 เทคโนโลยีไปสาธารณะกับการเปิดตัวของ บริษัท ที่เรียกว่า ayasdi [ 46 ]

ประกอบใหญ่ของการวิเคราะห์ข้อมูลกระบวนการโดยทั่วไปจะเป็นปรปักษ์กับ ช้าลง ใช้กระเป๋า ,[ 47 ] เลือกกระเป๋าโดยตรงแนบ ( DAS ) ในรูปแบบต่าง ๆจากไดรฟ์สถานะของแข็ง ( SSD ) ความจุสูง SATA ดิสก์ถูกฝังอยู่ภายในโหนดการประมวลผลแบบขนาน การจัดเก็บข้อมูลที่ใช้ร่วมกันของสถาปัตยกรรมเครือข่ายพื้นที่จัดเก็บ ( ซัน ) และ เครือข่ายเก็บแนบ ( NAS ) - คือว่าพวกเขาจะค่อนข้างช้า และแพงคุณสมบัติเหล่านี้ไม่สอดคล้องกับการวิเคราะห์ข้อมูลระบบใหญ่ที่เจริญบนประสิทธิภาพของระบบสินค้า โครงสร้างพื้นฐาน และต้นทุนต่ำ

จริง หรือใกล้เวลาจริงข้อมูลที่จัดส่งเป็นหนึ่งในคุณสมบัติพิเศษของใหญ่ข้อมูลวิเคราะห์ ศักยภาพจึงหลีกเลี่ยงและเมื่อใดก็ตามที่เป็นไปได้ข้อมูลในหน่วยความจำเป็นข้อมูลที่ดีบนแผ่นดิสก์การปั่นที่ส่วนอื่น ๆของ ชลบุรี เอฟซี ซาน เชื่อมต่อไม่ได้ ต้นทุนของซันที่จำเป็นสำหรับการวิเคราะห์ระดับการใช้งานเป็นอย่างมากที่สูงกว่าวิธีเก็บข้อมูลอื่น ๆ .

มีข้อได้เปรียบเช่นเดียวกับข้อเสียในการจัดเก็บที่ใช้ร่วมกันในการวิเคราะห์ข้อมูลใหญ่ แต่ผู้ปฏิบัติงานการวิเคราะห์ข้อมูลใหญ่ของ 2011 ไม่ชอบมัน . [ 48 ]

Being translated, please wait..

Other languages

The translation tool support: Afrikaans, Albanian, Amharic, Arabic, Armenian, Azerbaijani, Basque, Belarusian, Bengali, Bosnian, Bulgarian, Catalan, Cebuano, Chichewa, Chinese, Chinese Traditional, Corsican, Croatian, Czech, Danish, Detect language, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Frisian, Galician, Georgian, German, Greek, Gujarati, Haitian Creole, Hausa, Hawaiian, Hebrew, Hindi, Hmong, Hungarian, Icelandic, Igbo, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Luxembourgish, Macedonian, Malagasy, Malay, Malayalam, Maltese, Maori, Marathi, Mongolian, Myanmar (Burmese), Nepali, Norwegian, Odia (Oriya), Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Samoan, Scots Gaelic, Serbian, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tajik, Tamil, Tatar, Telugu, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uyghur, Uzbek, Vietnamese, Welsh, Xhosa, Yiddish, Yoruba, Zulu, Language translation.