คลังข้อมูลและระบบสารสนเทศใน microsoft sql server 2008

สารบัญ:

Anonim

ระบบสารสนเทศแบ่งออกเป็นสองประเภท (Casares, 2003):

  • ระบบปฏิบัติการ: เป็นระบบที่มีวัตถุประสงค์เพื่อสะท้อนสถานะและการดำเนินงานของ บริษัท ที่บันทึกธุรกรรมหรือการดำเนินงานรายวันดังนั้นพวกเขาจึงเป็นที่รู้จักกันในนามของระบบธุรกรรมออนไลน์ (OLTP) ระบบที่สนับสนุนการตัดสินใจ: พวกเขาคือผู้ที่มีวัตถุประสงค์เพื่อวัดและควบคุมการพัฒนาตัวแปรทางธุรกิจที่สำคัญการค้นหาเพื่อระบุโครงการและทำนายแนวโน้มจากข้อมูลที่สะสม

ตั้งแต่ยุคคอมพิวเตอร์เริ่มองค์กรได้ใช้ข้อมูลจากระบบปฏิบัติการเพื่อตอบสนองความต้องการข้อมูลของพวกเขา บางคนให้การเข้าถึงข้อมูลที่อยู่ในแอปพลิเคชั่นโดยตรง คนอื่น ๆ ได้ดึงข้อมูลจากฐานข้อมูลการดำเนินงานของพวกเขาเพื่อรวมพวกเขาในรูปแบบที่ไม่มีโครงสร้างในความพยายามที่จะให้บริการผู้ใช้ด้วยความต้องการข้อมูล (Casares, 2003)

Bill Inmon เป็นหนึ่งในผู้เขียนคนแรกที่เขียนเกี่ยวกับเรื่อง data warehouse เขากำหนด data data ในแง่ของลักษณะของ data repository (Inmon, 2007):

หัวข้อที่มุ่งเน้น: ข้อมูลในฐานข้อมูลจะถูกจัดระเบียบเพื่อให้องค์ประกอบข้อมูลทั้งหมดที่เกี่ยวข้องกับเหตุการณ์เดียวกันหรือวัตถุในโลกแห่งความจริงถูกเชื่อมโยงเข้าด้วยกัน

ตัวแปรเมื่อเวลาผ่านไป: การเปลี่ยนแปลงในข้อมูลในช่วงเวลาจะถูกบันทึกไว้เพื่อให้รายงานที่สามารถสร้างขึ้นสะท้อนให้เห็นถึงการเปลี่ยนแปลงเหล่านั้น

ไม่ลบเลือน: ข้อมูลจะไม่ถูกแก้ไขหรือลบเมื่อข้อมูลถูกเก็บไว้มันจะกลายเป็นข้อมูลแบบอ่านอย่างเดียวและจะถูกเก็บไว้เพื่อใช้อ้างอิงในอนาคต

รวม: ฐานข้อมูลมีข้อมูลของระบบปฏิบัติการทั้งหมดขององค์กรและข้อมูลดังกล่าวต้องสอดคล้องกัน

ตลาดข้อมูลเป็นส่วนย่อยของข้อมูลจากคลังข้อมูลสำหรับพื้นที่เฉพาะ จากมุมมองการออกแบบทุกอย่างที่ใช้กับคลังข้อมูลจะถูกนำไปใช้ในตลาดข้อมูล (Inmon, 2007)

โมเดลมิติถูกใช้มากที่สุดในระบบคลังข้อมูลซึ่งแตกต่างจากโมเดลเชิงสัมพันธ์ที่ใช้ในระบบ OLTP แบบจำลองนี้ขึ้นอยู่กับขนาดซึ่งเป็นตัวแทนของหมวดหมู่ข้อมูลคุณลักษณะที่เป็นตัวแทนระดับเดียวภายในมิติอาจมีลำดับชั้นของคุณลักษณะที่แสดงความสัมพันธ์ระหว่างคุณลักษณะที่แตกต่างกันและในที่สุดตารางข้อเท็จจริงซึ่งมีข้อมูลที่น่าสนใจ ซึ่งมีระดับความละเอียด ความละเอียดเป็นระดับต่ำสุดของข้อมูลที่จะถูกเก็บไว้ในตารางข้อเท็จจริง ขั้นตอนแรกในการออกแบบตารางความจริงคือการกำหนดความละเอียด

ไดอะแกรมการออกแบบมิติ:

  • Star Scheme: ตารางความเป็นจริงที่อยู่ตรงกลางที่เชื่อมต่อกับชุดตารางมิติ Snowflake Scheme: การปรับแต่งของตารางก่อนหน้านี้ที่บางมิติจะถูกทำให้เป็นมาตรฐานในตารางที่เล็กลง Constellation of Facts: ตารางข้อเท็จจริงหลาย ๆ ตัวแบ่งตารางมิติ พวกเขามองเห็นเป็นกลุ่มของข้อเท็จจริง

ฝ่ายบริหารจัดการตระหนักดีว่าวิธีหนึ่งในการเพิ่มประสิทธิภาพคือการใช้ประโยชน์จากแหล่งข้อมูลที่มีอยู่แล้วภายในองค์กรให้ดีที่สุด คลังข้อมูลปัจจุบันเป็นจุดสนใจของสถาบันขนาดใหญ่เนื่องจากเป็นสภาพแวดล้อมสำหรับองค์กรในการใช้ประโยชน์จากข้อมูลที่ได้รับการจัดการโดยแอปพลิเคชันการดำเนินงานที่หลากหลาย (Casares, 2003)

สถาปัตยกรรมของคลังข้อมูลประกอบด้วยสามระดับ (Casares, 2003):

  • ฐานข้อมูลต้นทาง (การผลิตและประวัติ) ฐานข้อมูลพร้อมข้อมูลสรุปที่แยกออกมาจากฐานการผลิต (คลังข้อมูล) ส่วนต่อประสานกับผู้ใช้ที่ดึงข้อมูลเพื่อการตัดสินใจ คลาสสิกคือ: แบบสอบถามและรายงานการวิเคราะห์หลายมิติและการขุดข้อมูล

ฐานข้อมูลต้นทาง: ประกอบด้วยฐานข้อมูลการผลิตและฐานข้อมูลเชิงประวัติ ฐานข้อมูลเหล่านี้สามารถนำไปใช้ในระบบประเภทต่าง ๆ: BD-Relational, BD-geographic, BD-ตำรา, ไฟล์, ฯลฯ คุณลักษณะทั่วไปคือพวกเขาเก็บรายการข้อมูลอะตอมซึ่งเกี่ยวข้องกับข้อมูลการผลิต แต่อาจไม่สามารถใช้เป็นพื้นฐานในการตัดสินใจได้ นอกจากนี้ความคิดเกี่ยวกับคุณภาพของข้อมูลในฐานข้อมูลเหล่านี้จะขึ้นอยู่กับความสอดคล้องของบันทึกเหล่านี้โดยไม่คำนึงถึงความเกี่ยวข้องกับปัญหา

ส่วนประกอบที่สำคัญในคลังข้อมูลคือ Data Dictionary (Meta-Data)ซึ่งมีการอธิบายข้อมูลที่เก็บไว้เพื่ออำนวยความสะดวกในการเข้าถึงข้อมูลเหล่านั้นผ่านเครื่องมือการใช้ประโยชน์จากคลังข้อมูล Data Dictionary สร้างการติดต่อระหว่างข้อมูลที่เก็บไว้และแนวคิดที่พวกเขาเป็นตัวแทนเพื่ออำนวยความสะดวกในการดึงข้อมูลโดยผู้ใช้

ส่วนต่อประสานกับผู้ใช้ที่ดึงข้อมูลเพื่อการตัดสินใจ:

  • อินเทอร์เฟซสำหรับคิวรีและรายงานที่ซับซ้อน: อนุญาตให้ผู้ใช้สร้างกราฟและรายงานจากข้อมูลที่มีอยู่ในคลังข้อมูลและอธิบายผ่านพจนานุกรมข้อมูล ฟังก์ชันทั่วไปของเครื่องมือเหล่านี้คือ: การจัดกลุ่มแบบไดนามิกและการไม่จัดกลุ่มข้อมูลในรายงานการเปลี่ยนแปลงตามลำดับของเขตข้อมูลรายงานการสร้างภาพข้อมูลผลลัพธ์ของแบบสอบถามในรูปแบบกราฟิก (บาร์เค้กคะแนน ฯลฯ) เครื่องมือเหล่านี้สร้างการแสดงออกในภาษาแบบสอบถามที่ดึงข้อมูลที่ร้องขอ (โดยทั่วไปคือ SQL) เชื่อมต่อกับที่เก็บข้อมูลเรียกผลลัพธ์และจัดรูปแบบตามข้อกำหนดที่กำหนด
  • ผลิตภัณฑ์วิเคราะห์ข้อมูล (OLAP): อนุญาตให้แสดงข้อมูลปัญหาในรูปของมิติข้อมูล ตัวอย่างเช่นถ้ามันเกี่ยวกับการขายผลิตภัณฑ์ในโซนที่แตกต่างกันปัญหาหนึ่งมิติของปัญหาคือโซนผลิตภัณฑ์อื่นและเวลาอื่น ด้วยวิธีนี้เคียวรีการวิเคราะห์ข้อมูลจากมิติหนึ่งตามส่วนอื่นจะดำเนินการทันที
  • เครื่องมือขุดข้อมูล: พวกเขาอนุญาตให้คุณสำรวจคลังข้อมูลในการค้นหาความสัมพันธ์ที่ไม่รู้จักหรือไม่คาดคิดระหว่างข้อมูล

แรงจูงใจหลักสำหรับการสร้างคลังข้อมูลมีดังต่อไปนี้ (Casares, 2003):

  • มีระบบสารสนเทศเพื่อสนับสนุนการตัดสินใจมีฐานข้อมูลที่อนุญาตให้ดึงความรู้จากข้อมูลประวัติที่เก็บไว้ในองค์กรออกแบบฐานข้อมูลที่อนุญาตให้ดำเนินการแบบสอบถามที่ไม่รู้จัก

Microsoft SQL Server 2008 เป็นแพลตฟอร์มสำหรับการสร้างและบำรุงรักษาคลังข้อมูลด้านล่างเป็นคุณสมบัติใหม่และแนวทางปฏิบัติที่ดีที่สุดที่เกี่ยวข้อง:

- การบีบอัดข้อมูล

การบีบอัดข้อมูลลดพื้นที่ที่ต้องใช้ในการจัดเก็บตารางและดัชนีช่วยให้ใช้พื้นที่จัดเก็บได้อย่างมีประสิทธิภาพยิ่งขึ้น

มีความเป็นไปได้ของการบีบอัดต่อบทความหรือต่อหน้า การบีบอัดตามบทความจะเก็บฟิลด์ทั้งหมดในรูปแบบความกว้างของตัวแปรการบีบอัดตามหน้าจะทำสิ่งเดียวกัน แต่ทำระหว่างบทความในหน้าเดียวกัน พจนานุกรมระดับหน้าจะใช้ในการจัดเก็บค่าทั่วไปรวมทั้งคำนำหน้าค่าคอลัมน์ทั่วไปจะถูกเก็บไว้เพียงครั้งเดียวในหน้า การบีบอัดทั้งสองรูปแบบสามารถใช้กับตารางและดัชนีได้

- การเข้ารหัสข้อมูลที่โปร่งใส

การเข้ารหัสข้อมูลแบบโปร่งใสช่วยให้สามารถจัดเก็บข้อมูลได้อย่างปลอดภัยโดยการเข้ารหัสไฟล์ฐานข้อมูล SQL Server ทำการเข้ารหัสและถอดรหัสโดยตรงทำให้กระบวนการโปร่งใสกับแอพพลิเคชั่นที่เชื่อมต่อ หากมีการใช้การบีบอัดข้อมูลและการเข้ารหัสในเวลาเดียวกันการดำเนินการจะต้องดำเนินการตามลำดับนี้

- ผู้ว่าการทรัพยากร

ผู้ว่าการทรัพยากรอนุญาตให้ผู้ดูแลระบบควบคุมและกำหนดทรัพยากรเช่นโปรเซสเซอร์และหน่วยความจำให้กับแอปพลิเคชันที่มีลำดับความสำคัญสูงสุด

- การเพิ่มโปรเซสเซอร์และหน่วยความจำที่น่าสนใจ

SQL Server Enterprise รุ่น 64 บิตเปิดใช้งานการเพิ่มตัวประมวลผลและหน่วยความจำโดยไม่จำเป็นต้องปิดเซิร์ฟเวอร์หรือ จำกัด การเชื่อมต่อที่มีอยู่

- ผู้ประกอบการรวม

ผู้ประกอบการ MERGE ใหม่ช่วยให้กระบวนการโหลดคลังข้อมูลง่ายขึ้นจากแหล่งที่มา ตัวดำเนินการใหม่นี้จะแยกบทความใหม่และที่ได้รับการปรับปรุงในฐานข้อมูลต้นทางและดำเนินการที่เหมาะสมในคลังข้อมูล

- ข้อมูลอวกาศชนิดใหม่

ชนิดข้อมูลเชิงพื้นที่ใหม่ GEOGRAPHY และ GEOMETRY ช่วยให้สามารถจัดเก็บข้อมูลเชิงพื้นที่ใน SQL Server 2008 ได้โดยตรง GEOGRAPHY อนุญาตให้แสดงข้อมูลทางภูมิศาสตร์ในสามมิติซึ่งใช้โดยแอปพลิเคชั่น GPS และ GEOMETRY ช่วยแสดงจุดในระนาบสองมิติ นอกจากนี้ยังมีการรวมกับ Virtual Earth ซึ่งอนุญาตให้แสดงภาพกราฟิกของตำแหน่งทางกายภาพ

คุณสมบัติใหม่ทั้งหมดเหล่านี้ทำให้ Microsoft SQL Server 2008 เป็นเครื่องมือขั้นสูงสำหรับการสร้างและบำรุงรักษาคลังข้อมูล

บรรณานุกรม

CASARES, C. (2003) การจัดทำคลังข้อมูล

INMON, B. (2007) โรงงานข้อมูล Coporate บริการให้คำปรึกษาของ Inmon

MICROSOFT (2008) แนวทางปฏิบัติที่ดีที่สุดสำหรับการจัดเก็บข้อมูลด้วย SQL Server 2008

MICROSOFT (2008) มีอะไรใหม่ใน SQL Server 2008

คลังข้อมูลและระบบสารสนเทศใน microsoft sql server 2008