ข้อมูลใหญ่. การวิเคราะห์ข้อมูลและสถาปัตยกรรม

สารบัญ:

Anonim

Big Data เป็นคำที่อธิบายปริมาณข้อมูลขนาดใหญ่ทั้งแบบมีโครงสร้างและไม่มีโครงสร้างซึ่งทำให้ธุรกิจท่วมทุกวัน แต่ไม่ใช่จำนวนข้อมูลที่สำคัญ สิ่งที่สำคัญกับ Big Data คือสิ่งที่องค์กรทำกับข้อมูล สามารถวิเคราะห์ข้อมูลขนาดใหญ่เพื่อรับแนวคิดที่นำไปสู่การตัดสินใจที่ดีขึ้นและการเคลื่อนไหวทางธุรกิจเชิงกลยุทธ์ (PowerData, 2015)

ใหญ่การจัดการข้อมูล-ข้อมูล itai

ข้อมูลขนาดใหญ่อธิบายกลยุทธ์การจัดการข้อมูลแบบองค์รวมที่รวมและรวมการจัดการข้อมูลและข้อมูลประเภทใหม่หลายประเภทเข้ากับข้อมูลดั้งเดิม (ORACLE, 2014)

ภายในคำจำกัดความที่กว้างขึ้นนั้นต้องคำนึงถึง 4 Vs เพื่อให้เข้าใจขอบเขตของแนวคิดได้ดีขึ้น:

ปริมาณ

มันหมายถึงปริมาณของข้อมูลที่ควรสังเกตว่าปริมาณมากขึ้นไม่ได้มีความหมายเหมือนกันกับข้อมูลมากขึ้นดังนั้นใน Big Data มีความจำเป็นที่การประมวลผลของปริมาณข้อมูลขนาดใหญ่มีความหนาแน่นต่ำ ORACLE กล่าวว่าข้อมูล Hadoopพวกเขาจะต้องไม่มีโครงสร้าง (ของค่าที่ไม่รู้จัก) เช่นการคลิกบนหน้าเว็บข้อความบนเครือข่ายสังคมและแม้แต่แอปพลิเคชันมือถือปริมาณการใช้งานที่มีอยู่บนเครือข่ายและอื่น ๆ งานของ Big Data คือการแปลงข้อมูลนี้เป็นข้อมูลที่มีประโยชน์ การอ้างถึงขนาดของที่เก็บข้อมูลอาจแตกต่างกันไปจากหลายสิบเทราไบต์ ร้อยเพตาไบต์ขึ้นอยู่กับแต่ละองค์กร

Hadoop

ระบบ Hadoop มีฟังก์ชั่นลดน้ำหนักการทำงานของนักพัฒนาเนื่องจากความยากของการเขียนโปรแกรมแบบขนานให้ระบบนิเวศที่ช่วยให้ผู้ใช้กระจายไฟล์ ในโหนดอนุญาตให้ดำเนินการหลายกระบวนการพร้อมกัน ระบบ Hadoop มีโมดูลควบคุมสำหรับการตรวจสอบข้อมูลช่วยให้สามารถผสานส่วนเสริมได้ซึ่งทำหน้าที่อำนวยความสะดวกในการทำงานการจัดการตรวจสอบและให้คำปรึกษาข้อมูลที่เก็บไว้

ความคุ้มค่า

ไม่ใช่เรื่องแปลกที่จะบอกว่าปัจจุบันข้อมูลหรือข้อมูลมีค่าอย่างไรก็ตามการที่พวกเขาไม่ได้สร้างยูทิลิตี้ใด ๆ แต่ต้องมีการค้นพบแอปพลิเคชันสำหรับพวกเขา มีเทคนิคเชิงปริมาณและการวิจัยมากมายที่ช่วยให้เราสามารถดึงค่าจากข้อมูลเหล่านี้ตัวอย่างที่ชัดเจนของเรื่องนี้คือการวิเคราะห์ความพึงพอใจของลูกค้าที่ดำเนินการโดย บริษัท หลายแห่งซึ่งทำหน้าที่เสนอข้อเสนอที่เกี่ยวข้องซึ่งรวมถึง ข้อมูลเช่นตำแหน่ง

ความสามารถในการจัดเก็บและประมวลผลข้อมูลทั้งหมดมีค่าใช้จ่ายอย่างไรก็ตามเนื่องจากความต้องการที่เพิ่มขึ้นสำหรับการวิเคราะห์พฤติกรรมออนไลน์ราคาในแง่ของการคำนวณและการจัดเก็บข้อมูลได้ลดลงเพื่อให้การวิเคราะห์ทางสถิติของขนาดใหญ่ จำนวนข้อมูลโดยไม่จำเป็นต้องแบ่งกลุ่มหรือใช้เพียงตัวอย่างเท่านั้น

ข้อเท็จจริงของความสามารถในการประมวลผลข้อมูลทั้งหมดเข้าด้วยกันถือว่าเป็นนวัตกรรมสำหรับการตัดสินใจทำให้พวกเขามีความแม่นยำมากขึ้น กระบวนการค้นหาข้อมูลที่มีค่าจำเป็นต้องมีส่วนร่วมของนักวิเคราะห์หรือผู้เชี่ยวชาญในสาขาผู้ใช้และผู้บริหาร ด้วยวิธีนี้ข้อมูลขนาดใหญ่ต้องเรียนรู้ที่จะทำนายพฤติกรรมของมนุษย์จดจำรูปแบบเพื่อเสนอการทำนายพฤติกรรม

ความหลากหลาย

แง่มุมนี้หมายถึงข้อมูลที่ไม่มีโครงสร้างและข้อมูลที่สามารถจัดเป็นกึ่งโครงสร้างได้ซึ่ง ได้แก่ ข้อความเสียงและวิดีโอ ข้อมูลทั้งหมดนี้ต้องการการประมวลผลเพิ่มเติมเพื่อสร้างความหมายบางอย่างรวมถึงการใช้ข้อมูลเมตาสนับสนุน. กล่าวอีกนัยหนึ่งแง่มุมนี้พยายามที่จะหาปริมาณความซับซ้อนของข้อมูลและลดลง

เมื่อเข้าใจแล้วข้อมูลที่ไม่มีโครงสร้างสามารถประมวลผลเป็นข้อมูลที่มีโครงสร้างกล่าวคือสามารถสรุปจัดวางและวางแผนสำหรับการตรวจสอบได้ อย่างไรก็ตามมีความซับซ้อนมากขึ้นเมื่อข้อมูลที่ได้รับจากแหล่งกำเนิดที่เป็นที่รู้จักเปลี่ยนแปลงโดยไม่ต้องแจ้งให้ทราบล่วงหน้าสิ่งนี้สร้างภาระสำหรับการวิเคราะห์

ความเร็ว

เป็นอัตราที่ได้รับข้อมูลและมีการดำเนินการบางอย่างเช่นการวิเคราะห์หรือประมวลผล เพื่อให้ได้ความเร็วที่สูงขึ้นความต้องการหน่วยความจำสูงไม่เพียง แต่เป็นไบต์ แต่ยังอยู่ในอำนาจการอ่านด้วยดังนั้นความสำคัญของเทคโนโลยีเช่นที่เก็บข้อมูลบนคลาวด์และความเร็วอินเทอร์เน็ตจึงเป็นสิ่งจำเป็น

ตัวอย่างเช่นแอปพลิเคชัน Internet of Things (Internet of Things) มีสถานะและการรวมการรักษาความปลอดภัยสิ่งเหล่านี้ต้องการการกระทำแบบเรียลไทม์รวมถึงการประเมินผล

อีกตัวอย่างคือผลิตภัณฑ์อัจฉริยะที่พร้อมใช้งานอินเทอร์เน็ตทำงานตามเวลาจริงให้ข้อมูลที่เกี่ยวข้องเช่นสถิติการใช้งานความปลอดภัยสถานที่และอื่น ๆ นี่คือวิธีที่แอปพลิเคชันอีคอมเมิร์ซพยายามใช้ตัวแปรเหล่านี้ผสมตำแหน่งของสมาร์ทโฟนเข้ากับความชอบส่วนตัวเพื่อสร้างข้อเสนอผ่านการโฆษณา จากมุมมองการปฏิบัติงานแอปพลิเคชันที่ออกแบบมาสำหรับโทรศัพท์มือถือมีฐานผู้ใช้จำนวนมากและปริมาณการใช้เครือข่ายที่กว้างขึ้นดังนั้นความคาดหวังของประสบการณ์และการตอบสนองจะต้องเกิดขึ้นทันที

ลักษณะ

เมื่อหลักการเหล่านี้ชัดเจนแล้วควรชี้ให้เห็นว่า Big Data นั้นเป็นชุดข้อมูลซึ่งจะเป็นการรวมกันของชุดข้อมูลดังกล่าวซึ่งมีปริมาณค่าความหลากหลายและความเร็วทำให้ยากต่อการจับลงทะเบียนจัดการกระบวนการ และการวิเคราะห์โดยใช้เทคโนโลยีและเครื่องมือทั่วไปเช่นฐานข้อมูลความสัมพันธ์สถิติและแพ็คเกจการสร้างภาพข้อมูลภายในเวลาที่จำเป็นเพื่อให้เป็นประโยชน์

ไม่ได้กำหนดขนาดที่ชุดข้อมูลเฉพาะจะต้องถูกพิจารณาว่าเป็นข้อมูลขนาดใหญ่เนื่องจากยังคงมีการเปลี่ยนแปลงเมื่อเวลาผ่านไปในปัจจุบันนักวิเคราะห์และผู้เชี่ยวชาญส่วนใหญ่ในสาขากล่าวว่าเป็นชุดข้อมูลที่เริ่มต้น จาก 30 เทราไบต์ ดังนั้นจึงมีความซับซ้อนอย่างมากในธรรมชาติเนื่องจากลักษณะที่ไม่มีโครงสร้างของข้อมูลที่สร้างขึ้นโดยเทคโนโลยีที่ใช้ในปัจจุบันเช่นการค้นหาข้อมูลบนอินเทอร์เน็ตเครือข่ายสังคมออนไลน์และการโต้ตอบที่เกิดขึ้นในพวกเขา (Facebook, Twitter, Google และอื่น ๆ), บันทึกหน้า, เซ็นเซอร์อุปกรณ์ (การวัด, ตำแหน่ง GPS), แล็ปท็อป, สมาร์ทโฟนและบันทึกของศูนย์บริการรวมถึงเครื่องจักรและยานพาหนะ

เพื่อให้สามารถใช้บิ๊กดาต้าได้อย่างมีประสิทธิภาพนั้นจะต้องรวมกับข้อมูลที่มีโครงสร้าง (ฐานข้อมูลเชิงสัมพันธ์) ของแอพพลิเคชั่นทางการค้าทั่วไปเช่น ERP หรือ CRM

ความสำคัญ

ความจริงที่ว่าบิ๊กดาต้าให้คำตอบสำหรับคำถามมากมายที่บางครั้ง บริษัท ไม่ทราบว่าควรตอบคือสิ่งที่ทำให้เครื่องมือนี้มีประโยชน์อย่างมากในระดับธุรกิจเนื่องจากเป็นจุดอ้างอิง ปริมาณของข้อมูลที่ต้องการอนุญาตให้ข้อมูลถูกหล่อหลอมในลักษณะที่ บริษัท ต้องการ โดยการทำเช่นนั้นพวกเขาสามารถระบุปัญหาได้อย่างเข้าใจได้มากขึ้น

ข้อเท็จจริงของความสามารถในการรวบรวมข้อมูลจำนวนมากและอนุญาตให้พบแนวโน้มเฉพาะภายในพวกเขาช่วยให้ บริษัท ในการตัดสินใจได้อย่างรวดเร็วมีประสิทธิภาพและไม่มีปัญหา สิ่งที่สำคัญอย่างยิ่งที่จะเน้นคือช่วยให้สามารถขจัดปัญหาที่เกิดขึ้นก่อนที่ปัญหาจะกระทบต่อชื่อเสียงของ บริษัท หรือทำให้ผลประโยชน์เสียหาย

Big Data ช่วยให้องค์กรใช้ประโยชน์จากข้อมูลของพวกเขาผ่านการวิเคราะห์โดยใช้มันเพื่อระบุโอกาสในการเติบโตหรือปรับปรุง สิ่งนี้ทำให้เกิดการเคลื่อนไหวทางธุรกิจที่ชาญฉลาดการทำงานที่มีประสิทธิภาพมากขึ้นผลกำไรที่สูงขึ้นและความพึงพอใจของลูกค้า ประโยชน์ที่ควรได้รับการพิจารณาผ่านเครื่องมือนี้เช่น:

ลดต้นทุน การตัดสินใจที่รวดเร็ว สร้างผลิตภัณฑ์และ

บริการ

ลดต้นทุน

เทคโนโลยีข้อมูลที่ทรงพลังและมีศักยภาพมากที่สุดเช่นระบบ Hadoop และการวิเคราะห์บนคลาวด์จะต้องถูกนำเสนอ สิ่งเหล่านี้สร้างความได้เปรียบด้านต้นทุนเนื่องจากเมื่อมันมาถึงการจัดเก็บข้อมูลจำนวนมากมีอุปทานจำนวนมากที่แสดงการเติบโตแบบเลขชี้กำลังในปีต่อ ๆ ไปนอกจากนี้ยังช่วยให้สามารถระบุวิธีการตลาดที่มีประสิทธิภาพมากขึ้น

การตัดสินใจที่รวดเร็วขึ้น

อ้างถึงระบบ Hadoop การวิเคราะห์ความเร็วและข้อมูลรวมกับความสามารถในการวิเคราะห์แหล่งข้อมูลใหม่ให้บริการแก่ บริษัท เพื่อให้มีข้อมูลพร้อมใช้งานทันที (ไม่ว่าจะเป็นบทสรุปหรือข้อมูลเฉพาะที่จำเป็นต้องใช้) และด้วยวิธีนี้ทำการตัดสินใจตามสิ่งที่ได้เรียนรู้ (ปัญญาประดิษฐ์)

สร้างผลิตภัณฑ์ / บริการใหม่

บิ๊กดาต้านำเสนอความสามารถในการวิเคราะห์และวัดความต้องการของลูกค้าดังนั้นความพึงพอใจของพวกเขาจะได้รับจากการวิเคราะห์ข้อมูลของพวกเขาซึ่งเป็นไปได้ที่จะรู้ด้วยความมั่นใจในสิ่งที่พวกเขาต้องการหรือต้องการ ผ่านการวิเคราะห์ บริษัท สร้างผลิตภัณฑ์และบริการใหม่เพื่อตอบสนองความต้องการของลูกค้า พวกเขาสามารถสร้างความต้องการใหม่ ๆ ที่พวกเขาไม่รู้ด้วยซ้ำ

ใบสมัคร

ตามที่สามารถสังเกตได้ก่อนหน้านี้พลังในการเข้าถึงของ Big Data นั้นเป็นไปไม่ได้จริง ๆ แล้วข้อ จำกัด ที่กำหนดโดย บริษัท เดียวกันเนื่องจากมันขึ้นอยู่กับพวกเขาว่าจะทำอย่างไรกับข้อมูล ด้านล่างนี้เป็นวิธีที่เครื่องมือนี้สามารถใช้ในภาคส่วนต่างๆ:

สุขภาพ

ข้อมูลขนาดใหญ่มีข้อมูลจำนวนมากในอุตสาหกรรมการดูแลสุขภาพ ส่วนใหญ่เป็นประวัติผู้ป่วยแผนสุขภาพทั่วไปและเฉพาะด้านข้อมูลการประกันและขอบเขตและยากต่อการจัดการข้อมูล ข้อมูลทั้งหมดนี้ให้ข้อมูลที่เป็นกุญแจสำคัญเมื่อใช้การวิเคราะห์ นั่นคือเหตุผลที่เทคโนโลยีการวิเคราะห์ข้อมูลมีความสำคัญอย่างยิ่งต่อการดูแลสุขภาพ ด้วยการวิเคราะห์ข้อมูลจำนวนมากเหล่านี้การวินิจฉัยผู้ป่วยและตัวเลือกการรักษาสามารถให้เกือบจะในทันทีจึงสร้างความเป็นไปได้ของการโจมตีโรคก่อนที่พวกเขาจะไม่สามารถแก้ไขได้

การบริหาร

หนึ่งในความท้าทายหลักที่ผู้บริหารต้องเผชิญคือการประกันคุณภาพและเพิ่มประสิทธิภาพการทำงานด้วยงบประมาณที่ จำกัด โดยทั่วไป ข้อมูลขนาดใหญ่ช่วยให้การดำเนินงานคล่องตัวขึ้นผ่านเทคโนโลยีทำให้การจัดการมีมุมมองที่กว้างขึ้นของกิจกรรม

การโฆษณา

การใช้สมาร์ทโฟนที่เพิ่มขึ้นรวมถึงอุปกรณ์ที่มีการรวม GPS ช่วยให้ผู้โฆษณาสามารถกำหนดเป้าหมายผู้บริโภคเมื่ออยู่ใกล้ร้านค้าเฉพาะเช่นร้านอาหารร้านหนังสือหรือร้านกาแฟ สิ่งนี้จะสร้างโอกาสให้กับผู้ให้บริการเช่นสร้างรายได้เพิ่มรับโอกาสใหม่ ๆ วางตำแหน่งและบรรลุความสำเร็จ

ขาย

การบริการลูกค้ากลายเป็นสิ่งสำคัญอย่างยิ่งสำหรับทุกธุรกิจและลูกค้าได้กลายเป็นความต้องการที่มีรายละเอียดน้อยที่สุดดังนั้นการขายจึงมีการพัฒนาอย่างต่อเนื่อง เข้าใจสิ่งที่พวกเขาต้องการและเมื่อพวกเขาต้องการ

ข้อมูลขนาดใหญ่ช่วยให้ผู้ค้าปลีกสามารถตอบสนองความต้องการเหล่านั้นได้ ด้วยจำนวนข้อมูลที่ไม่สิ้นสุดจากโปรแกรมความภักดีของลูกค้าพฤติกรรมการจับจ่ายสินค้าและแหล่งข้อมูลอื่น ๆ ผู้ค้าปลีกไม่เพียง แต่มีความเข้าใจลูกค้าอย่างลึกซึ้ง แต่ยังสามารถคาดการณ์แนวโน้มแนะนำผลิตภัณฑ์ใหม่และเพิ่มผลกำไร

การท่องเที่ยว

ต้องให้ความพึงพอใจของลูกค้าเนื่องจากเป็นกุญแจสำคัญสำหรับอุตสาหกรรมการท่องเที่ยว แต่คุณลักษณะนี้ยากที่จะวัดโดยเฉพาะในเวลาที่เหมาะสม ตัวอย่างเช่นรีสอร์ทและคาสิโนมีโอกาสเพียงเล็กน้อยที่จะเปลี่ยนประสบการณ์ของลูกค้าที่ไม่ดี การวิเคราะห์ข้อมูลขนาดใหญ่ช่วยให้ บริษัท เหล่านี้สามารถรวบรวมข้อมูลลูกค้าใช้การวิเคราะห์และระบุปัญหาที่อาจเกิดขึ้นได้ทันทีก่อนที่จะสายเกินไป

ความท้าทายของ Big Data

ลักษณะเฉพาะของ Big Data ทำให้คุณภาพของข้อมูลเผชิญกับความท้าทายหลายประการ:

ปริมาณ ความคุ้มค่า ความหลากหลาย ความเร็ว ความจริง

ความหลากหลายในแหล่งข้อมูลและประเภท

ด้วยแหล่งที่มาจำนวนมากชนิดข้อมูลและโครงสร้างที่ซับซ้อนความยากในการรวมข้อมูลจึงเพิ่มขึ้น

แหล่งข้อมูลขนาดใหญ่มีมากมาย:

  • ข้อมูลอินเทอร์เน็ตและมือถือข้อมูลอินเทอร์เน็ตของสิ่งต่าง ๆ ข้อมูลรายสาขาที่รวบรวมโดย บริษัท ผู้เชี่ยวชาญ ข้อมูลทดลอง

และชนิดข้อมูลก็มีดังนี้:

  1. ประเภทข้อมูลที่ไม่มีโครงสร้าง: เอกสารวิดีโอไฟล์เสียง ฯลฯ ประเภทข้อมูลกึ่งโครงสร้าง: ซอฟต์แวร์สเปรดชีตรายงานประเภทข้อมูลที่มีโครงสร้าง

มีข้อมูลเพียง 20% เท่านั้นที่มีโครงสร้างและสามารถทำให้เกิดข้อผิดพลาดมากมายหากเราไม่ดำเนินการโครงการคุณภาพข้อมูล

ปริมาณข้อมูล

ดังที่เราได้เห็นแล้วปริมาณของข้อมูลมีขนาดใหญ่มากและทำให้การดำเนินการตามกระบวนการคุณภาพของข้อมูลนั้นซับซ้อนขึ้นในเวลาอันสมควร

เป็นการยากที่จะรวบรวมทำความสะอาดรวมและรับข้อมูลคุณภาพสูงอย่างรวดเร็ว ใช้เวลานานในการแปลงชนิดที่ไม่มีโครงสร้างเป็นชนิดที่มีโครงสร้างและประมวลผลข้อมูล

การระเหย

ข้อมูลมีการเปลี่ยนแปลงอย่างรวดเร็วและทำให้มันสั้นมาก เพื่อแก้ปัญหาเราต้องการพลังการประมวลผลที่สูงมาก

หากเราทำไม่ดีการประมวลผลและการวิเคราะห์ตามข้อมูลเหล่านี้สามารถสร้างข้อสรุปที่ผิดพลาดซึ่งอาจนำไปสู่ข้อผิดพลาดในการตัดสินใจ

ไม่มีมาตรฐานคุณภาพของข้อมูลแบบครบวงจร

ในปี 1987 องค์กรระหว่างประเทศเพื่อการมาตรฐาน (ISO) เผยแพร่มาตรฐาน ISO 9000 เพื่อรับประกันคุณภาพของผลิตภัณฑ์และบริการ อย่างไรก็ตามการศึกษามาตรฐานคุณภาพข้อมูลไม่ได้เริ่มขึ้นจนถึงปี 1990 และไม่ถึงปี 2011 ที่ ISO เผยแพร่มาตรฐานคุณภาพข้อมูล ISO 8000

มาตรฐานเหล่านี้จำเป็นต้องพัฒนาและปรับปรุง นอกจากนี้การวิจัยเกี่ยวกับข้อมูลคุณภาพข้อมูลขนาดใหญ่เพิ่งจะเริ่มขึ้นเมื่อไม่นานมานี้และแทบไม่มีผลลัพธ์ใด ๆ เลย

คุณภาพของข้อมูลขนาดใหญ่เป็นกุญแจสำคัญไม่เพียง แต่เพื่อให้ได้เปรียบในการแข่งขัน แต่ยังเพื่อป้องกันไม่ให้เราทำข้อผิดพลาดเชิงกลยุทธ์และการดำเนินงานอย่างจริงจังตามข้อมูลที่ผิดพลาดพร้อมผลที่อาจร้ายแรงมาก

แผนการกำกับดูแลข้อมูล

การกำกับดูแลหมายถึงการตรวจสอบให้แน่ใจว่าข้อมูลได้รับอนุญาตจัดระเบียบและมีสิทธิ์ผู้ใช้ที่จำเป็นในฐานข้อมูลที่มีจำนวนข้อผิดพลาดน้อยที่สุดในขณะที่รักษาความเป็นส่วนตัวและความปลอดภัย การบรรลุความสมดุลที่ง่ายภายในลักษณะเหล่านี้เป็นเรื่องยากโดยเฉพาะอย่างยิ่งเมื่อความเป็นจริงของสถานที่และวิธีการที่ข้อมูลและการโฮสต์ถูกประมวลผลในลักษณะที่เคลื่อนไหวอย่างต่อเนื่อง

การเข้าถึงข้อมูลที่ละเอียด

คุณไม่สามารถควบคุมข้อมูลได้อย่างมีประสิทธิภาพหากไม่มีการควบคุมแบบละเอียด

การควบคุมแบบละเอียดสามารถทำได้ผ่านนิพจน์การควบคุมการเข้าถึง นิพจน์เหล่านี้ใช้การจัดกลุ่มและตรรกะบูลีนเพื่อควบคุมการเข้าถึงและการอนุญาตข้อมูลที่ยืดหยุ่นด้วยการอนุญาตตามบทบาทและการตั้งค่าการเปิดเผย

ในระดับต่ำสุดข้อมูลลับจะได้รับการปกป้องโดยการซ่อนไว้และในระดับสูงสุดมีสัญญาลับสำหรับนักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ BI สิ่งนี้สามารถทำได้ด้วยความสามารถในการปิดบังข้อมูลและมุมมองที่แตกต่างกันซึ่งข้อมูลดิบจะถูกล็อคมากที่สุดเท่าที่จะเป็นไปได้และจะมีการเข้าถึงมากขึ้นเรื่อย ๆ จนกระทั่งด้านบนผู้ดูแลระบบจะได้รับการเปิดเผยมากขึ้น

คุณสามารถมีระดับการเข้าถึงที่แตกต่างกันซึ่งให้ความปลอดภัยแบบบูรณาการมากขึ้น

การป้องกันข้อมูล

การกำกับดูแลจะไม่เกิดขึ้นหากไม่มีความปลอดภัย ณ จุดสิ้นสุดของห่วงโซ่ เป็นสิ่งสำคัญในการสร้างขอบเขตที่ดีและวางไฟร์วอลล์ไว้รอบ ๆ ข้อมูลรวมกับระบบการรับรองความถูกต้องที่มีอยู่และมาตรฐาน เมื่อมาถึงการรับรองความถูกต้องเป็นสิ่งสำคัญสำหรับ บริษัท ที่จะซิงค์กับระบบที่พิสูจน์แล้ว

ด้วยการรับรองความถูกต้องมันคือทั้งหมดที่เกี่ยวกับการดูวิธีรวมกับ LDAP, Active Directory และบริการไดเรกทอรีอื่น ๆ เครื่องมือต่าง ๆ เช่น Kerberos ยังสามารถรองรับการรองรับการพิสูจน์ตัวตน แต่สิ่งสำคัญไม่ได้เป็นการสร้างโครงสร้างพื้นฐานแยกต่างหาก แต่เพื่อรวมเข้ากับโครงสร้างที่มีอยู่

การเข้ารหัสลับ

ขั้นตอนต่อไปหลังจากปกป้องขอบเขตและรับรองความถูกต้องของการเข้าถึงข้อมูลแบบละเอียดทั้งหมดเพื่อให้แน่ใจว่าไฟล์และข้อมูลที่สามารถระบุตัวบุคคลได้ (PII) ได้รับการเข้ารหัสและ tokenized end-to-end ของไปป์ไลน์ข้อมูล

เมื่อเกินขอบเขตและเข้าถึงระบบการป้องกันข้อมูล PII เป็นสิ่งสำคัญอย่างยิ่ง ข้อมูลนั้นจะต้องได้รับการเข้ารหัสดังนั้นไม่ว่าใครจะสามารถเข้าถึงข้อมูลได้พวกเขาสามารถเรียกใช้การสแกนที่พวกเขาต้องการได้โดยไม่ต้องเปิดเผยข้อมูลใด ๆ

การตรวจสอบและวิเคราะห์

กลยุทธ์ไม่ทำงานหากไม่มีการตรวจสอบ ระดับของการมองเห็นและความรับผิดชอบในทุกขั้นตอนของกระบวนการคือสิ่งที่ช่วยให้ฝ่ายไอทีสามารถ "ควบคุม" ข้อมูลได้มากกว่าเพียงแค่ตั้งค่านโยบายการควบคุมและควบคุมการเข้าถึงและหวังให้ดีที่สุด นอกจากนี้ยังเป็นวิธีที่ บริษัท ต่างๆสามารถรักษากลยุทธ์ของพวกเขาให้ทันสมัยในสภาพแวดล้อมที่ซึ่งวิธีที่เราดูข้อมูลและเทคโนโลยีที่เราใช้ในการจัดการและวิเคราะห์นั้นกำลังเปลี่ยนแปลงทุกวัน

เราอยู่ในช่วงเริ่มต้นของ Big Data และ IoT (Internet of Things) และเป็นสิ่งสำคัญที่จะต้องสามารถติดตามการเข้าถึงและจดจำรูปแบบในข้อมูล

การตรวจสอบและการแยกวิเคราะห์สามารถทำได้ง่ายเหมือนการติดตามไฟล์ JavaScript Object Notation (JSON)

สถาปัตยกรรมข้อมูลแบบรวม

ในที่สุดผู้จัดการฝ่าย IT ที่ดูแลกลยุทธ์การจัดการข้อมูลทางธุรกิจจะต้องคิดถึงรายละเอียดของการเข้าถึงอย่างละเอียดการตรวจสอบความปลอดภัยการเข้ารหัสและการตรวจสอบ แต่มันไม่ควรหยุดเพียงแค่นั้น แต่คุณต้องคิดว่าองค์ประกอบเหล่านี้รวมเข้ากับสถาปัตยกรรมข้อมูลทั่วโลกของคุณอย่างไร คุณต้องคิดด้วยว่าโครงสร้างพื้นฐานนั้นจะต้องปรับขนาดและปลอดภัยได้อย่างไรตั้งแต่การรวบรวมข้อมูลและการเก็บข้อมูลไปจนถึง BI การวิเคราะห์และบริการของบุคคลที่สามอื่น ๆ การกำกับดูแลข้อมูลเป็นเรื่องเกี่ยวกับการคิดกลยุทธ์และการดำเนินการตามที่เป็นอยู่เกี่ยวกับเทคโนโลยี

มันเป็นมากกว่ากฎความปลอดภัย มันเป็นสถาปัตยกรรมที่ไม่ซ้ำกันซึ่งบทบาทเหล่านี้ถูกสร้างและประสานทั่วทั้งแพลตฟอร์มและเครื่องมือทั้งหมดที่นำมาให้

โครงร่างวิทยานิพนธ์

ข้อเสนอ 1

ใช้ข้อมูลขนาดใหญ่เพื่อวิเคราะห์ข้อมูลของสังคมของเวราครูซและสามารถป้องกันอาชญากรรมได้โดยการติดตามกิจกรรมเครือข่ายที่อำนวยความสะดวกในการกำหนดเส้นทางและแก้ไขบุคคล

ข้อเสนอที่ 2

สร้างข้อเสนอเพื่อการปรับปรุงโครงสร้างทางสังคมปรับขนาดจาก laggards เพื่อให้เกิดการรวมที่รวดเร็วขึ้น

แหล่งอ้างอิง

ผู้เชี่ยวชาญด้านการจัดการข้อมูล (ตุลาคม, 2012) ข้อมูลขนาดใหญ่: มันคืออะไร

ความสำคัญความท้าทายและการกำกับดูแล มีนาคม 2018 จากเว็บไซต์ PowerData:

ORACLE (สิงหาคม 2014) ธุรกิจข้อมูลขนาดใหญ่ มีนาคม 2018 จากเว็บไซต์ ORACLE ละตินอเมริกา:

Quer, A. (5 กันยายน 2013) Big Data เกี่ยวข้องกับ Hadoop อย่างไร มีนาคม 2018 จากเว็บไซต์ PowerData:

______________________

ระบบโอเพ่นซอร์สที่ใช้ในการจัดเก็บประมวลผลและวิเคราะห์ข้อมูลจำนวนมาก

เทราไบต์ (TB) เทียบเท่ากับ 10 12ไบต์นั่นคือ 1,000,000,000,000 (หนึ่งพันล้านไบต์)

Petabyte (PB) เท่ากับ 10 15ไบต์นั่นคือ 1,000,000,000,000,000 ไบต์

ชุดข้อมูลหรือข้อมูลแบบลอจิคัลที่กำหนดโดยชื่อและกำหนดค่าเป็นยูนิตแบบสแตนด์อะโลนที่สมบูรณ์สำหรับระบบหรือผู้ใช้

จุดตัดหรือสหภาพหลายองค์ประกอบที่มารวมกันในที่เดียวกัน

ส่วนขยายหรือเพิ่มเติมอาจหมายถึงการอัพเกรดที่ติดตั้งได้สำหรับโครงการไอที

กลุ่มข้อมูลที่อธิบายเนื้อหาข้อมูลของวัตถุที่เรียกว่าทรัพยากร

Internet of Things ขับเคลื่อนวัตถุที่ครั้งหนึ่งเคยถูกเชื่อมต่อผ่านวงจรปิดเช่นผู้สื่อสารกล้องเซ็นเซอร์และอื่น ๆ และทำให้พวกเขาสามารถสื่อสารกันทั่วโลกผ่านการใช้เครือข่ายเครือข่าย

ดาวน์โหลดไฟล์ต้นฉบับ

ข้อมูลใหญ่. การวิเคราะห์ข้อมูลและสถาปัตยกรรม