iPAS AI應用規劃師 考試重點
L11201 資料基本概念與來源 (Data Fundamentals and Sources)
篩選主題:
全部主題
資料類型與結構
資料來源
大數據特性
資料庫基礎
資料品質概念
重要性:
全部重要性
★★★★★
★★★★
★★★
★★
★
搜尋:
搜尋
主題分類
1
資料類型與結構
2
資料來源
3
大數據特性
4
資料庫基礎
5
資料品質概念
#1
★★★★★
結構化資料
(
Structured Data
)
核心概念
指具有
固定格式或欄位
的資料,通常儲存在
關聯式資料庫
中,易於
查詢和分析
。例如:
試算表
(
Spreadsheet
) 中的表格、
資料庫
中的客戶資料。 (對應能力 K04, K11)
#2
★★★★★
非結構化資料
(
Unstructured Data
)
核心概念
指
沒有預定格式或組織結構
的資料,佔數據總量的大部分。分析較為複雜。例如:
電子郵件、社交媒體貼文、影片、音訊檔案、圖片
。 (對應能力 K04, K11)
#3
★★★★
半結構化資料
(
Semi-structured Data
)
核心概念
介於結構化與非結構化之間,
不符合傳統資料庫的格式,但包含標籤或標記
來分隔語義元素和強制記錄與欄位的層次結構。例如:
JSON
(
JavaScript Object Notation
)、
XML
(
Extensible Markup Language
) 文件。 (對應能力 K04, K11)
#4
★★★★
資料類型 (數值、類別、文字、時間序列等)
核心概念
區分不同的資料類型對於
選擇合適的分析方法和 AI 模型
至關重要。
數值資料
(
Numerical Data
):可測量的量(連續或離散)。
類別資料
(
Categorical Data
):表示分組或類別(名目或序數)。
文字資料
(
Text Data
):非結構化的書面語言。
時間序列資料
(
Time Series Data
):按時間順序記錄的數據點。
(對應能力 K11)
#5
★★★★★
內部資料來源 (
Internal Data Sources
)
核心概念
指
組織內部
產生和收集的資料。通常是
結構化
的,且
品質相對可控
。例如:
銷售記錄、客戶資料庫 (
CRM
)、庫存系統、生產數據
。 (對應能力 K04)
#6
★★★★
外部資料來源 (
External Data Sources
)
核心概念
指來自
組織外部
的資料。來源多樣,結構和品質不一。例如:
市場研究報告、政府統計數據、社群媒體資料、合作夥伴資料、第三方數據供應商
。 (對應能力 K04)
#7
★★★★
開放資料
(
Open Data
)
核心概念
指由
政府機構或特定組織
發布,可供
任何人自由使用、重複使用和重新分發
的資料。通常有
特定格式和授權條款
。例如:
政府開放資料平台上的天氣、交通、人口統計資料
。 (對應能力 K04, S01)
#8
★★★
物聯網
(
IoT
) 資料
核心概念
由
連接網路的感測器和設備
產生的資料流。通常是
大量、即時
的資料。例如:
智慧手環的健康數據、工廠機器的運作狀態、智慧家庭設備的感測資料
。 (對應能力 K04)
#9
★★★★★
大數據
(
Big Data
) 的 3Vs (或 5Vs)
核心概念
理解
大數據
的主要特徵,通常以 "Vs" 描述:
Volume
(大量性)
:數據量極大。
Velocity
(高速性)
:數據生成和處理速度快。
Variety
(多樣性)
:數據類型和結構多樣(結構化、非結構化、半結構化)。
(常補充)
Veracity
(真實性)
:數據的準確性和可信度。
(常補充)
Value
(價值性)
:從數據中提取價值的能力(密度低)。
(樣題 #4) (對應能力 K04, K11)
#10
★★
大數據
與
AI
的關係
核心概念
大數據
是
AI
發展的
重要燃料
,提供了
訓練複雜模型所需的豐富資訊
。
AI
技術則提供了
處理和分析大數據的有效工具
,從中
挖掘洞見與價值
。 (對應能力 K04, K05)
#11
★★★★
資料庫
(
Database
) 的基本概念
核心概念
理解
資料庫
是
有組織地儲存和管理資料
的系統。認識
資料表
(
Table
)、
欄位
(
Column/Field
)、
記錄
(
Row/Record
) 等基本元素。 (對應能力 K04)
#12
★★★
關聯式資料庫
(
Relational Database
) 概念
核心概念
了解
關聯式資料庫
以
表格
形式儲存資料,並透過
鍵值
(
Key
) 建立
表格間的關聯
。常用
SQL
(
Structured Query Language
) 進行操作。 (對應能力 K04)
#13
★★
NoSQL
資料庫概念
核心概念
理解
NoSQL
( "
Not Only SQL
" ) 資料庫是
非關聯式
的,提供
更靈活的資料模型
(如
文件型、鍵值型、圖形
),常用於處理
大數據和非結構化數據
。 (對應能力 K04)
#14
★★★
資料倉儲
(
Data Warehouse
) 與
資料超市
(
Data Mart
)
核心概念
理解
資料倉儲
是
整合來自多個來源
的資料,用於
報告和分析
的中央儲存庫。
資料超市
則是
資料倉儲的子集
,專注於
特定業務部門或主題
。 (對應能力 K04, K06)
#15
★★★★★
資料品質
(
Data Quality
) 的重要性
核心概念
資料品質直接影響 AI 模型的準確性和可靠性
。"垃圾進,垃圾出" (
Garbage In, Garbage Out
) 強調了
輸入資料品質
的重要性。低品質資料可能導致
錯誤決策和資源浪費
。 (對應能力 K11, S08)
#16
★★★★★
資料品質
的關鍵維度
核心概念
理解衡量
資料品質
的常見維度:
完整性
(
Completeness
)
:是否存在缺失值。
準確性
(
Accuracy
)
:資料是否真實反映現實。
一致性
(
Consistency
)
:資料在不同系統或時間點是否一致。
及時性
(
Timeliness
)
:資料是否足夠新以供使用。
有效性/合規性
(
Validity / Conformity
)
:資料是否符合定義的格式或規則。
唯一性
(
Uniqueness
)
:是否存在重複記錄。
(對應能力 K11, S08)
#17
★★★
中繼資料/元數據
(
Metadata
)
核心概念
理解
元數據
是「
關於資料的資料
(
Data about data
)」。它描述了資料的
內容、結構、來源、品質
等信息,對於
理解和管理資料
非常重要。 (對應能力 K04, K11)
沒有找到符合條件的重點。
↑