วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Data management (con.) and Business Intelligence 5202112685

 5202112685
Data Warehouse Process
  1. เริ่มจากการสร้าง Meta data เพื่อเป็นการบอกว่ารายละเอียดของข้อมูลที่นำมาจากทั้ง Operational data และ External data  เช่น  บอกว่าข้อมูลที่นำมานำมากี่ Attribute, ปรับเปลี่ยนข้อมูลอย่างไรบ้าง,  เอา้ข้อมูลมาจากแหล่งใด, สรุปข้อมูลอย่างไร
  2. Data staging   ได้แก่ Extract  Clean  Transform  Load
  3. Data warehouse business subject  จะประกอบด้วย Data cube หลายๆอัน  เพื่อกำหนดเ้ค้าโครง
  4. Business Views  โดยนำ upload ขึ้นใช้งานบน web ในรูปแบบ Dashboard เพื่อให้ผู้บริหารสามารถใ้ช้งานได้
 Data Mart
         ในองค์กรที่มีผู้ใช้ข้อมูลจำนวนมาก  การที่จะให้ผู้ใช้งานข้อมูลทุกคนเข้าใช้งานโดยตรงจาก Enterprise data warehouse อาจทำให้เกิดปัญหากับระบบได้  จึงมีความจำเป็นที่จะต้องสร้าง Data martไว้สำหรับใช้ในแต่ละแผนก
        โดยที่ Data mart จะเป็นการตัดแบ่งข้อมูล / คัดลอกเฉพาะบางส่วนของ Data warehouse มาไว้ที่ Data mart  ในมุมมองของผู้ใช้  ดังน้นในแต่ละแผนกจะสร้าง Data mart ไว้เป็นของแผนกเอง
         Data mart แบ่งออกเป็น 2 ประเภท  ได้แก่
  1. Replicated (dependent) data marts เป็นdata mart ที่เกิดจากการคัดลอกบางส่วนมาจาก Data warehouse
  2. Stand-alone data marts  เป็นdata mart ที่เกิดจากแต่ละแผนก  โดยที่องค์กรยังไม่ได้สร้าง Enterprise data warehouse ไว้  ในแต่ละแผนกที่พร้อมแล้วจึงทำการสร้าง data mart  ของตนเองไว้ก่อน เพื่อพร้อมแล้วจึงค่อยนำ data martมารวมกันสร้างเป็น data warehouse
Data Cube
  ในบางครั้งเรียกว่า OLAP   เป็นฐานข้อมูลที่มีหลายมิติ  และแต่ละมิติมีความสัมพันธ์กัน  โดยการที่ทำให้เป็น Data cube มีประโยชน์ที่ ทำให้สามารถเชื่อมโยงข้อมูลได้ในหลายมิติ  รวมถึงการ Rollups & Drill downs

Business Intelligence
  คือการนำ architectures, tools, database, application และ methodologies มารวมกัน
โดยมีกระบวนการ transform ข้อมูลดิบ ไปสู่ข้อมูลเพื่อให้สามารถนำไปตัดสินใจได้ และนำไปสู่การปฎิบัติจริง  ซึ่งมีจุดมุ่งหมายให้ผู้บริหารสามารถเข้าถึงข้อมูล  และจัดการข้อมูล  เพื่อให้เหมาะสมในการนำไปใช้ในการวิเคราะห์ได้
              
Business intelligence มี function และ feature แบ่งออกเป็น 3 กลุ่ม  ได้แก่ 
  1. Data integration eg. ETL, EII
  2. Analytics eg. Predictive analytics , Data mining, OLAP
  3. Reporting and Analysis eg. Scorecards, Dashboards, Visualization tools
  •  Dashboard and Scorecards   เป็นส่วนที่่ช่วยในการวัด Performance  ดังนั้นผู้ใช้จึงอยู่ในระดับผู้บริหาร  
         Performance Dashboard  จะเ็ป็นตัวช่วยทำให้เห็นภาพ  และควบคุมในการวัด Performance
         Performance Scorecards  จะเ็ป็นตัวช่วยทำให้เห็นภาพ  ทำให้เห็นเป็น chart progress เทียบกับ strategic , tactical , goal และ target 

  • Online Analytical Procesing (OLTP)  เป็น Software ที่ช่วยให้ผู้บริหารสามารถเข้าถึงข้อมูลได้รวดเร็ว  สม่ำเสมอ  และสามารถปรับเปลี่ยนข้อมูล  เช่น  จากตารางเป็นกราฟ  ทำให้ผู้บริหารสามารถดึงข้อมูลที่ตนเองต้องการได้
  • Data mining   คือการ Extract ข้อมูลที่ไม่เคยรู้มาก่อนจาก database  ขนาดใหญ่  และ้ต้องทำกับข้อมูลจำนวนมากเพื่อขจัด bias  ช่วยทำให้เห็นภาพ trend / pattern ได้ ทั้งนี้ประโยชน์จะมากหรือน้อยขึ้นกับความสามารถในการตีความ
                Yield from data mining
  • Clustering
  • Classification
  • Association
  • Sequence discovert
  • Prediction

  • Text mining  เป็นการจัดการกับข้อมูลประเภท nonstructured เ่่ช่น  ข้อมูลติชมของลูกค้า  โดยจะจัดความสัมพันธ์ของข้อมูลต่างๆ  ที่มีความเกี่ยวเนื่องกันไว้ในกลุ่มเดียวกัน 

ไม่มีความคิดเห็น:

แสดงความคิดเห็น