iPAS AI應用規劃師 考試重點

L11201 資料基本概念與來源 (Data Fundamentals and Sources)
主題分類
1
資料類型與結構
2
資料來源
3
大數據特性
4
資料庫基礎
5
資料品質概念
#1
★★★★★
結構化資料 (Structured Data)
核心概念
指具有固定格式或欄位的資料,通常儲存在關聯式資料庫中,易於查詢和分析。例如:試算表 (Spreadsheet) 中的表格、資料庫中的客戶資料。 (對應能力 K04, K11)
#2
★★★★★
非結構化資料 (Unstructured Data)
核心概念
沒有預定格式或組織結構的資料,佔數據總量的大部分。分析較為複雜。例如:電子郵件、社交媒體貼文、影片、音訊檔案、圖片。 (對應能力 K04, K11)
#3
★★★★
半結構化資料 (Semi-structured Data)
核心概念
介於結構化與非結構化之間,不符合傳統資料庫的格式,但包含標籤或標記來分隔語義元素和強制記錄與欄位的層次結構。例如:JSON (JavaScript Object Notation)、XML (Extensible Markup Language) 文件。 (對應能力 K04, K11)
#4
★★★★
資料類型 (數值、類別、文字、時間序列等)
核心概念
區分不同的資料類型對於選擇合適的分析方法和 AI 模型至關重要。
  • 數值資料 (Numerical Data):可測量的量(連續或離散)。
  • 類別資料 (Categorical Data):表示分組或類別(名目或序數)。
  • 文字資料 (Text Data):非結構化的書面語言。
  • 時間序列資料 (Time Series Data):按時間順序記錄的數據點。
(對應能力 K11)
#5
★★★★★
內部資料來源 (Internal Data Sources)
核心概念
組織內部產生和收集的資料。通常是結構化的,且品質相對可控。例如:銷售記錄、客戶資料庫 (CRM)、庫存系統、生產數據。 (對應能力 K04)
#6
★★★★
外部資料來源 (External Data Sources)
核心概念
指來自組織外部的資料。來源多樣,結構和品質不一。例如:市場研究報告、政府統計數據、社群媒體資料、合作夥伴資料、第三方數據供應商。 (對應能力 K04)
#7
★★★★
開放資料 (Open Data)
核心概念
指由政府機構或特定組織發布,可供任何人自由使用、重複使用和重新分發的資料。通常有特定格式和授權條款。例如:政府開放資料平台上的天氣、交通、人口統計資料。 (對應能力 K04, S01)
#8
★★★
物聯網 (IoT) 資料
核心概念
連接網路的感測器和設備產生的資料流。通常是大量、即時的資料。例如:智慧手環的健康數據、工廠機器的運作狀態、智慧家庭設備的感測資料。 (對應能力 K04)
#9
★★★★★
大數據 (Big Data) 的 3Vs (或 5Vs)
核心概念
理解大數據的主要特徵,通常以 "Vs" 描述:
  • Volume (大量性):數據量極大。
  • Velocity (高速性):數據生成和處理速度快。
  • Variety (多樣性):數據類型和結構多樣(結構化、非結構化、半結構化)。
  • (常補充) Veracity (真實性):數據的準確性和可信度。
  • (常補充) Value (價值性):從數據中提取價值的能力(密度低)。
(樣題 #4) (對應能力 K04, K11)
#10
★★
大數據AI的關係
核心概念
大數據AI發展的重要燃料,提供了訓練複雜模型所需的豐富資訊AI技術則提供了處理和分析大數據的有效工具,從中挖掘洞見與價值。 (對應能力 K04, K05)
#11
★★★★
資料庫 (Database) 的基本概念
核心概念
理解資料庫有組織地儲存和管理資料的系統。認識資料表 (Table)、欄位 (Column/Field)、記錄 (Row/Record) 等基本元素。 (對應能力 K04)
#12
★★★
關聯式資料庫 (Relational Database) 概念
核心概念
了解關聯式資料庫表格形式儲存資料,並透過鍵值 (Key) 建立表格間的關聯。常用 SQL (Structured Query Language) 進行操作。 (對應能力 K04)
#13
★★
NoSQL 資料庫概念
核心概念
理解 NoSQL ( "Not Only SQL" ) 資料庫是非關聯式的,提供更靈活的資料模型(如文件型、鍵值型、圖形),常用於處理大數據和非結構化數據。 (對應能力 K04)
#14
★★★
資料倉儲 (Data Warehouse) 與資料超市 (Data Mart)
核心概念
理解資料倉儲整合來自多個來源的資料,用於報告和分析的中央儲存庫。資料超市則是資料倉儲的子集,專注於特定業務部門或主題。 (對應能力 K04, K06)
#15
★★★★★
資料品質 (Data Quality) 的重要性
核心概念
資料品質直接影響 AI 模型的準確性和可靠性。"垃圾進,垃圾出" (Garbage In, Garbage Out) 強調了輸入資料品質的重要性。低品質資料可能導致錯誤決策和資源浪費。 (對應能力 K11, S08)
#16
★★★★★
資料品質的關鍵維度
核心概念
理解衡量資料品質的常見維度:
  • 完整性 (Completeness):是否存在缺失值。
  • 準確性 (Accuracy):資料是否真實反映現實。
  • 一致性 (Consistency):資料在不同系統或時間點是否一致。
  • 及時性 (Timeliness):資料是否足夠新以供使用。
  • 有效性/合規性 (Validity / Conformity):資料是否符合定義的格式或規則。
  • 唯一性 (Uniqueness):是否存在重複記錄。
(對應能力 K11, S08)
#17
★★★
中繼資料/元數據 (Metadata)
核心概念
理解元數據是「關於資料的資料 (Data about data)」。它描述了資料的內容、結構、來源、品質等信息,對於理解和管理資料非常重要。 (對應能力 K04, K11)
沒有找到符合條件的重點。