Data Warehouse Process
- เริ่มจากการสร้าง Meta data เพื่อเป็นการบอกว่ารายละเอียดของข้อมูลที่นำมาจากทั้ง Operational data และ External data เช่น บอกว่าข้อมูลที่นำมานำมากี่ Attribute, ปรับเปลี่ยนข้อมูลอย่างไรบ้าง, เอา้ข้อมูลมาจากแหล่งใด, สรุปข้อมูลอย่างไร
- Data staging ได้แก่ Extract Clean Transform Load
- Data warehouse business subject จะประกอบด้วย Data cube หลายๆอัน เพื่อกำหนดเ้ค้าโครง
- Business Views โดยนำ upload ขึ้นใช้งานบน web ในรูปแบบ Dashboard เพื่อให้ผู้บริหารสามารถใ้ช้งานได้
ในองค์กรที่มีผู้ใช้ข้อมูลจำนวนมาก การที่จะให้ผู้ใช้งานข้อมูลทุกคนเข้าใช้งานโดยตรงจาก Enterprise data warehouse อาจทำให้เกิดปัญหากับระบบได้ จึงมีความจำเป็นที่จะต้องสร้าง Data martไว้สำหรับใช้ในแต่ละแผนก
โดยที่ Data mart จะเป็นการตัดแบ่งข้อมูล / คัดลอกเฉพาะบางส่วนของ Data warehouse มาไว้ที่ Data mart ในมุมมองของผู้ใช้ ดังน้นในแต่ละแผนกจะสร้าง Data mart ไว้เป็นของแผนกเอง
Data mart แบ่งออกเป็น 2 ประเภท ได้แก่
- Replicated (dependent) data marts เป็นdata mart ที่เกิดจากการคัดลอกบางส่วนมาจาก Data warehouse
- Stand-alone data marts เป็นdata mart ที่เกิดจากแต่ละแผนก โดยที่องค์กรยังไม่ได้สร้าง Enterprise data warehouse ไว้ ในแต่ละแผนกที่พร้อมแล้วจึงทำการสร้าง data mart ของตนเองไว้ก่อน เพื่อพร้อมแล้วจึงค่อยนำ data martมารวมกันสร้างเป็น data warehouse
ในบางครั้งเรียกว่า OLAP เป็นฐานข้อมูลที่มีหลายมิติ และแต่ละมิติมีความสัมพันธ์กัน โดยการที่ทำให้เป็น Data cube มีประโยชน์ที่ ทำให้สามารถเชื่อมโยงข้อมูลได้ในหลายมิติ รวมถึงการ Rollups & Drill downs
Business Intelligence
คือการนำ architectures, tools, database, application และ methodologies มารวมกัน
โดยมีกระบวนการ transform ข้อมูลดิบ ไปสู่ข้อมูลเพื่อให้สามารถนำไปตัดสินใจได้ และนำไปสู่การปฎิบัติจริง ซึ่งมีจุดมุ่งหมายให้ผู้บริหารสามารถเข้าถึงข้อมูล และจัดการข้อมูล เพื่อให้เหมาะสมในการนำไปใช้ในการวิเคราะห์ได้
Business intelligence มี function และ feature แบ่งออกเป็น 3 กลุ่ม ได้แก่
- Data integration eg. ETL, EII
- Analytics eg. Predictive analytics , Data mining, OLAP
- Reporting and Analysis eg. Scorecards, Dashboards, Visualization tools
- Dashboard and Scorecards เป็นส่วนที่่ช่วยในการวัด Performance ดังนั้นผู้ใช้จึงอยู่ในระดับผู้บริหาร
Performance Scorecards จะเ็ป็นตัวช่วยทำให้เห็นภาพ ทำให้เห็นเป็น chart progress เทียบกับ strategic , tactical , goal และ target
- Online Analytical Procesing (OLTP) เป็น Software ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลได้รวดเร็ว สม่ำเสมอ และสามารถปรับเปลี่ยนข้อมูล เช่น จากตารางเป็นกราฟ ทำให้ผู้บริหารสามารถดึงข้อมูลที่ตนเองต้องการได้
- Data mining คือการ Extract ข้อมูลที่ไม่เคยรู้มาก่อนจาก database ขนาดใหญ่ และ้ต้องทำกับข้อมูลจำนวนมากเพื่อขจัด bias ช่วยทำให้เห็นภาพ trend / pattern ได้ ทั้งนี้ประโยชน์จะมากหรือน้อยขึ้นกับความสามารถในการตีความ
- Clustering
- Classification
- Association
- Sequence discovert
- Prediction
- Text mining เป็นการจัดการกับข้อมูลประเภท nonstructured เ่่ช่น ข้อมูลติชมของลูกค้า โดยจะจัดความสัมพันธ์ของข้อมูลต่างๆ ที่มีความเกี่ยวเนื่องกันไว้ในกลุ่มเดียวกัน
ไม่มีความคิดเห็น:
แสดงความคิดเห็น