卷積神經網路 (CNN) 的核心技術中,哪個是用於降低特徵圖的維度?
A
卷積層 (Convolutional Layer)
D
循環連接 (Recurrent Connection)
池化層 (Pooling Layer),例如最大池化 (Max Pooling) 或平均池化 (Average Pooling),主要功能是進行下採樣 (Downsampling),縮減特徵圖的空間尺寸(寬度和高度)。這有助於減少計算量、降低模型對位置微小變化的敏感度(增加強健性),並提取更顯著的特徵。卷積層主要用於特徵提取;權重共享是卷積層的關鍵特性,大幅減少參數數量;循環連接是遞迴神經網路 (Recurrent Neural Network, RNN) 的核心。
下列哪一項是遞迴神經網路 (RNN) 的核心技術?
A
循環連接 (Recurrent Connection)
B
卷積層 (Convolutional Layer)
遞迴神經網路 (Recurrent Neural Network, RNN) 最核心的技術是其「循環連接」。這種連接允許網路將前一個時間步驟的輸出(或隱藏狀態)作為當前時間步驟輸入的一部分,從而使網路能夠捕捉序列資料中的時間依賴性或順序關係。卷積層和權重共享是卷積神經網路 (Convolutional Neural Network, CNN) 的核心;門控機制是長短期記憶網路 (Long Short-Term Memory, LSTM)、閘控循環單元 (Gated Recurrent Unit, GRU) 等改進型 RNN 用來解決梯度消失問題的關鍵技術,但基礎 RNN 的核心是循環連接。
長短期記憶網路 (LSTM) 的核心技術是下列哪一個?
B
卷積層 (Convolutional Layer)
D
自注意力機制 (Self-Attention Mechanism)
長短期記憶網路 (Long Short-Term Memory, LSTM) 是對遞迴神經網路 (RNN) 的一種改進,其核心技術在於引入了精密的「門控機制」,包括輸入門 (Input Gate)、遺忘門 (Forget Gate) 和輸出門 (Output Gate)。這些門控單元共同控制著資訊在記憶單元 (Cell State) 中的流動、更新和輸出,使得 LSTM 能夠有效地學習和記憶長期依賴關係,克服了傳統 RNN 中的梯度消失/爆炸問題。卷積層是 CNN 的核心;權重共享雖在 LSTM 中也存在(跨時間步驟),但不是其區別於 RNN 的核心創新;自注意力機制是 Transformer 模型的核心。
大型語言模型 (LLM) 的核心架構是什麼?
B
循環神經網路 (Recurrent Neural Network)
C
卷積神經網路 (Convolutional Neural Network)
D
編碼器-解碼器架構 (Encoder-Decoder Architecture)
目前絕大多數大型語言模型 (Large Language Model, LLM),如 GPT 系列、BERT、PaLM 等,其核心架構都是基於 Transformer 模型。Transformer 架構以其自注意力機制 (Self-Attention Mechanism) 取代了 RNN 的循環連接和 CNN 的卷積操作(在序列處理的主要部分),能夠更有效地捕捉文本中的長距離依賴關係,並支持大規模平行訓練。雖然 Transformer 本身也是一種編碼器-解碼器架構 (Encoder-Decoder Architecture),但其內部基於自注意力的機制才是其區別於傳統 RNN/CNN Encoder-Decoder 的核心。
當模型的預測效果與隨機猜測相同時,AUC 值應為?
AUC (Area Under the ROC Curve, ROC曲線下面積) 是衡量二元分類模型效能的指標。ROC (Receiver Operating Characteristic) 曲線是以偽陽性率 (False Positive Rate, FPR) 為橫軸,真陽性率 (True Positive Rate, TPR) 為縱軸繪製的曲線。一個完全隨機猜測的模型,其 ROC 曲線會近似於從 (0,0) 到 (1,1) 的對角線。這條對角線下的面積正好是 0.5。因此,當模型效果等同於隨機猜測時,AUC 值約為 0.5。AUC > 0.5 表示模型效果優於隨機猜測;AUC < 0.5 表示模型效果劣於隨機猜測;AUC = 1 表示完美分類器;AUC = 0 表示完全錯誤的分類器。
根據文件,模型的預測效果比隨機猜測還差時,AUC 值會小於哪個數值?
如上一題所述,AUC = 0.5 代表模型的預測效果與隨機猜測相當。如果模型的預測效果比隨機猜測還要差,意味著其 ROC 曲線位於對角線下方,因此其曲線下面積(AUC 值)會小於 0.5。AUC 值的範圍通常在 0 到 1 之間,不會是負數。
正規化 (Regularization) 主要是為了防止模型出現下列哪種情況?
正規化 (Regularization) 是一種在機器學習中常用的技術,其主要目的是防止模型「過度擬合」 (Overfitting)。過度擬合指的是模型在訓練資料上表現極好,但對未見過的資料(測試資料或實際應用資料)泛化能力差。正規化透過在模型的損失函數中加入一個懲罰項(通常與模型參數的大小有關,如 L1 或 L2 正規化),限制模型的複雜度,從而提高模型的泛化能力。欠擬合 (Underfitting) 是指模型未能充分學習訓練資料的模式;訓練速度和準確度是模型效能的其他方面,正規化主要針對的是過度擬合問題。
正規化通常透過在損失函數中加入什麼來實現?
B
激活函數 (Activation Function)
正規化的核心思想是在標準的損失函數(如均方誤差或交叉熵)基礎上,額外添加一個「懲罰項」 (Penalty Term),也稱為正規化項。這個懲罰項通常是模型權重(參數)的函數,例如 L1 範數(權重絕對值之和)或 L2 範數(權重平方和)。優化器 (Optimizer) 在最小化這個包含懲罰項的總損失函數時,會傾向於選擇較小的權重,從而降低模型複雜度,防止過度擬合。激活函數 (Activation Function) 是神經元非線性轉換的部分;優化器是尋找最小損失的演算法;學習率 (Learning Rate) 是優化器中的一個超參數。
Transformer 的核心技術是?
A
自注意力機制 (Self-Attention Mechanism)
B
循環連接 (Recurrent Connection)
C
卷積層 (Convolutional Layer)
Transformer 模型的核心創新和關鍵技術是「自注意力機制」 (Self-Attention Mechanism)。這個機制允許模型在處理序列中的某個元素(如一個詞)時,能夠同時考慮到序列中所有其他元素與該元素的相關性("注意力"),並根據這些相關性來計算該元素的表示。這使得 Transformer 能有效捕捉長距離依賴,並且計算可以高度平行化。循環連接是 RNN 的核心;卷積層和池化層是 CNN 的核心。
NoSQL 資料庫的 BASE 原則中,B 代表什麼?
C
基本可用 (Basically Available)
D
龐大數據 (Big Data Efficient)
BASE 原則是對 NoSQL (Not Only SQL, 不僅是SQL/非關聯式) 資料庫一致性模型的一種描述,與傳統關聯式資料庫的 ACID 原則相對。BASE 代表:Basically Available (基本可用), Soft state (軟狀態), Eventually consistent (最終一致性)。因此,B 代表 Basically Available。
什麼時候應該使用 NoSQL 而非 SQL 資料庫?
NoSQL 資料庫通常在需要高擴展性 (Scalability)、靈活資料模型、能容忍最終一致性 (Eventual Consistency) 的場景下更有優勢,特別是處理高併發請求和存儲海量資料 (Big Data)。交易型應用和會計系統通常需要強一致性 (Strong Consistency),遵循 ACID (Atomicity, Consistency, Isolation, Durability) 原則,更適合使用 SQL (Structured Query Language, 結構化查詢語言) 資料庫。
MongoDB 屬於哪種類型的 NoSQL 資料庫?
C
列式儲存 (Column-Family Store)
MongoDB 是一種典型的「文件型資料庫」 (Document Store)。它儲存的資料單元是類似 JSON (JavaScript Object Notation) 格式的 BSON (Binary JSON) 文件。這種結構允許儲存複雜的、巢狀的資料,並且模式 (Schema) 非常靈活。
Google Bigtable 屬於哪種類型的 NoSQL 資料庫?
C
列式儲存 (Column-Family Store)
Google Bigtable 是一種「列式儲存」 (Column-Family Store) 類型的 NoSQL 資料庫。它被設計用來處理海量的結構化資料,資料按列鍵 (Row Key)、列族 (Column Family)、列限定符 (Column Qualifier) 和時間戳 (Timestamp) 組織。
NoSQL 資料庫的優勢之一是?
NoSQL 資料庫的主要優勢通常包括高度可擴展性 (Scalability),尤其擅長水平擴展 (Scale-out),以及靈活的資料模型 (Flexible Data Models),支持非結構化、半結構化資料。強一致性和複雜交易支援是傳統 SQL 資料庫的強項 (ACID)。NoSQL 的目標不是完全取代 SQL 資料庫,而是為特定應用場景提供更合適的解決方案。大多數 NoSQL 資料庫不使用標準 SQL 語法。
ACID 原則中的 I (Isolation) 代表什麼?
ACID 是關聯式資料庫管理系統 (RDBMS) 中保證交易 (Transaction) 可靠執行的四個關鍵特性:Atomicity (原子性), Consistency (一致性), Isolation (隔離性), Durability (持久性)。I 代表 Isolation (隔離性),指並行執行的多個交易之間應該相互隔離,如同它們是循序執行的一樣,避免相互干擾。
NoSQL 的 BASE 原則主要用於什麼類型的應用?
BASE 原則(基本可用、軟狀態、最終一致性)犧牲了強一致性來換取高可用性和分區容錯性 (Partition Tolerance)(根據 CAP 定理)。這種特性非常適合需要處理海量資料、高併發存取且對資料的短暫不一致性有一定容忍度的「分散式大數據應用」,例如社交網路資訊流、日誌分析、推薦系統等。銀行交易系統、企業 ERP (Enterprise Resource Planning)、會計記帳等應用通常對資料一致性有極高要求,需要 ACID 交易保證,更適合使用傳統的關聯式資料庫。
SQL 中的 JOIN 操作主要用於什麼?
在 SQL (結構化查詢語言) 中,JOIN 操作的核心目的是根據某些共同的欄位(連接鍵),將兩個或多個表格中的資料列「關聯」起來,合併成一個結果集。這使得可以查詢和組合儲存在不同規範化表格中的相關資料。增加資料冗餘通常是反規範化的結果;查詢 JSON 在某些現代 SQL 資料庫中有特定函數支援,但不是 JOIN 的主要目的;壓縮資料是儲存層面的優化。
哪一個 NoSQL 資料庫適合處理推薦系統?
推薦系統常常涉及到實體(如使用者、商品、標籤)之間的複雜關係(如購買、按讚、屬於某類別)。「圖形資料庫」 (Graph Database),如 Neo4j,非常擅長儲存和查詢這種網狀的關係資料。它可以高效地執行涉及多步關係遍歷的查詢,這對於建構和優化推薦系統非常有幫助。MySQL、PostgreSQL 和 SQLite 都是關聯式資料庫 (SQL),在處理複雜關係時效率可能不如圖形資料庫。
特徵工程中的特徵選擇方法包括以下哪一項?
特徵工程 (Feature Engineering) 包含特徵創建、特徵轉換和特徵選擇等步驟。「特徵選擇」 (Feature Selection) 的目的是從原始特徵集合中選出一個子集。常用的特徵選擇方法包括:過濾法(如資訊增益 Information Gain、卡方檢驗 Chi-squared test)、包裹法(如遞迴特徵消除 Recursive Feature Elimination)、嵌入法(如 LASSO 回歸)。使用 PCA (Principal Component Analysis, 主成分分析) 是特徵提取/降維方法。根據時間序列生成新特徵屬於特徵創建。類別型資料編碼(如 One-Hot Encoding)屬於特徵轉換。
資料降維技術如 PCA 的主要作用是什麼?
主成分分析 (Principal Component Analysis, PCA) 是一種常用的無監督「資料降維」 (Dimensionality Reduction) 技術。其主要作用是將原始高維資料投影到一個新的低維子空間,同時盡可能多地保留原始資料的變異性。主要目的包括:減少特徵數量、降低計算複雜度、去除冗餘特徵、資料視覺化。PCA 本身不直接增強資料一致性、移除異常值或增加樣本資料。
布林值 (Boolean) 主要用於表示什麼概念?
布林值 (Boolean) 是一種資料型態,只有兩個可能的取值:真 (True) 和假 (False)。它主要用於表示邏輯判斷的結果或狀態的開關。
根據文件,下列哪個選項可能使用布林值 (Boolean) 作為資料型態?
人名通常是字串 (String)。生日通常是日期 (Date)。年齡通常是整數 (Integer)。性別在最簡化的情況下(例如,只區分男/女,或 True/False 代表某一種性別),可以使用布林值表示。但在選項中,性別是最可能用布林值簡化表示的。
若使用布林值 (Boolean) 表示性別,下列哪種表示方式是可行的?
布林值本身是 True 或 False。選項 1 使用整數。選項 3 和 4 是基於其他屬性的條件判斷。選項 2 將類別對應到布林值(例如 `is_male = True`),這種邏輯映射是可行的,是概念上用布林值代表性別分類的方式。
何者無法判斷資料集中趨勢?
直方圖、分佈圖和箱形圖都能提供關於資料集中趨勢(如眾數、中位數、分佈峰值)的資訊。雷達圖主要用於比較多個變數在不同維度上的數值,通常不用於展示單一資料集的集中趨勢。
SQL 資料庫的 ACID 原則不包括以下哪一項?
C
最終一致性 (Eventual Consistency)
ACID 原則包括:原子性 (Atomicity)、一致性 (Consistency)、隔離性 (Isolation)、持久性 (Durability)。「最終一致性」 (Eventual Consistency) 是 NoSQL 資料庫中 BASE 原則的一部分,與 ACID 的強一致性要求不同。
NoSQL 常見的四種類型不包括哪一種?
A
時序資料庫 (Time-Series Database)
NoSQL 資料庫傳統的四大主要類型是:鍵值儲存、文件型資料庫、列式儲存 (Column-Family Store)、圖形資料庫。時序資料庫雖然也是非關聯式資料庫,但通常被視為一個獨立的、針對特定應用(時間序列資料)優化的類別,不總是被包含在傳統的四大分類中。
哪一種 NoSQL 資料庫最適合用於社交網路關係?
C
列式儲存 (Column-Family Store)
社交網路的核心是「關係」。圖形資料庫 (Graph Database) 非常擅長儲存和查詢這種以節點(如使用者、貼文)和邊(如朋友關係、按讚)構成的網狀關係資料,能高效執行關係遍歷查詢。
SQL 和 NoSQL 在擴展性上的主要區別是什麼?
擴展性 (Scalability) 分為垂直擴展 (Vertical Scaling / Scale-up,增加單機資源) 和水平擴展 (Horizontal Scaling / Scale-out,增加機器數量)。傳統 SQL 資料庫通常更傾向於或更容易實現垂直擴展。大多數 NoSQL 資料庫在設計上就考慮了分散式架構,因此更擅長水平擴展。
SQL 資料庫遵循哪一個標準語法語言?
SQL (Structured Query Language, 結構化查詢語言) 本身就是一種標準化的查詢語言,專門用於管理和操作關聯式資料庫管理系統 (RDBMS)。JSON 和 YAML 是資料序列化格式;NoSQL 不是一種語言,而是對非關聯式資料庫的統稱。
NoSQL 資料庫的 BASE 原則中,B 代表什麼?
C
基本可用 (Basically Available)
D
龐大數據 (Big Data Efficient)
BASE 原則中的 B 代表 Basically Available (基本可用),強調系統在部分節點故障時仍能提供服務。
什麼時候應該使用 NoSQL 而非 SQL 資料庫?
NoSQL 適用於需要高擴展性、靈活資料模型、能容忍最終一致性的場景,特別是高併發和海量資料儲存。
「王小明」這個人名屬於哪種資料型態?
人名是由一串字元組成的文本資訊,通常使用「字串」 (String) 或文本 (Text) 類型來表示。
「1990-01-01」這個生日最適合用哪種資料型態儲存?
像 "1990-01-01" 這樣的標準日期格式,最適合使用專門的「日期」 (Date) 或日期時間 (Datetime) 類型來儲存,以便進行日期相關的操作。
「O 型」血型通常屬於下列哪種資料型態?
血型(如 A 型, B 型, AB 型, O 型)是一種分類資訊,最常用「字串」 (String) 類型來表示,直接儲存 "A", "B", "AB", "O" 等。
「台北市信義區 00 路 XX 號」這個住址應該使用哪種資料型態儲存?
地址包含文字、數字和符號,是一長串的文本資訊,因此最適合使用「字串」 (String) 或文本 (Text) 類型來儲存。
表示性別時,下列哪種資料型態最不常用?
表示性別常用的資料型態包括字串、類別、布林值(簡化情況)或整數代碼。「浮點數」 (Float) 用於表示帶有小數的數值,完全不適合表示性別這種離散的分類資訊。
年齡「25」通常是什麼資料型態?
年齡通常是一個整數值,表示年數。因此,最適合使用「整數」 (Integer) 類型來儲存。
大數據 (Big Data) 的 5V 特性中,代表資料多樣性的是哪一項?
大數據的 5V 特性通常指:Volume (資料量)、Velocity (資料速度)、Variety (多樣性)、Veracity (真實性)、Value (價值)。Variety 指的是資料來源和類型多樣,包括結構化、半結構化和非結構化資料。
在大數據時代的轉變中,下列哪一項是其中之一?
大數據時代相對於傳統資料分析帶來了轉變:傾向處理全量資料、更側重發現相關性、核心挑戰是接受並處理資料的紛繁複雜性 (Variety)、常常需要動態/即時分析 (Velocity)。因此,接受資料的紛繁複雜性是大數據時代的重要特徵。
以下哪一項不是大數據 (Big Data) 的核心特性?
大數據的核心特性常用多個 "V" 概括,最常見的是 Volume, Velocity, Variety, Veracity, Value。"Viability" (可行性) 通常不是描述大數據本身固有特性的標準術語。
大數據 (Big Data) 中,資料的真實性 (Veracity) 代表什麼?
大數據的 Veracity (真實性或準確性) 指的是資料的可信賴程度和品質,涉及到資料是否準確、沒有錯誤、沒有偏差等問題。確保資料的準確性是 Veracity 的核心含義。
以下哪些屬於非結構化資料的範疇?
結構化資料具有固定格式(如資料庫表格、銷售報表)。非結構化資料沒有預定義模型(如文本文件、圖像、音頻)。會議的發言記錄(通常是文本或錄音)和公文資料(通常是文件格式)屬於非結構化資料。學生 成績資料庫是結構化資料。(原始答案為 2, 3,此處標記第一個選項 B)
在評估 AI 模型的泛化能力時,最需要警惕:
泛化能力指模型對未見過新資料的預測能力。評估泛化能力時,最需要警惕的是「過度擬合」 (Overfitting),即模型過度學習訓練資料的細節和雜訊,導致在新資料上表現差。回應延遲、訓練時間、資源消耗是效能效率考量。
以下哪一項是 GDPR(歐盟通用資料保護規則)資料保護的基本原則?
歐盟通用資料保護規則 (General Data Protection Regulation, GDPR) 確立了多項原則,包括:合法、公平和透明處理;目的限制;資料最小化;準確性;儲存限制;完整性和保密性;問責制。「資料收集與處理透明」是其核心原則之一。GDPR 並未完全禁止跨境傳輸,而是設定嚴格條件;它保護個人資料;匿名化是推薦措施,非普遍強制。
資料最小化 (Data Minimisation) 的主要原則是什麼?
資料最小化原則要求資料控制者應該只收集和處理對於達成特定、明確且合法的目的而言「必要」的個人資料,避免收集過多、與目的無關的資料。
資料加密的傳輸通常使用哪種技術?
為了防止資料在傳輸過程中被竊聽或篡改,常用的加密傳輸技術包括 HTTPS (Hypertext Transfer Protocol Secure, 超文本傳輸安全協定) 和 VPN (Virtual Private Network, 虛擬私人網路)。RSA 和 AES 是加密演算法本身。防火牆用於網路存取控制。IDS (Intrusion Detection System, 入侵偵測系統) 用於檢測惡意活動。
依據歐盟人工智慧法案 (AI Act),下列何者屬於「不可接受風險」的 AI?
歐盟人工智慧法案 (Artificial Intelligence Act, AI Act) 將對人類安全、生計和權利構成明顯威脅的 AI 應用歸類為「不可接受風險」(Unacceptable Risk),原則上應被禁止。典型的例子包括由公共機構進行的通用目的社會評分 (Social Scoring) 系統。聊天機器人風險較低(有限風險);政府行政 AI 和醫療診斷 AI 通常屬於高風險。
歐盟人工智慧法案 (AI Act) 規定,違規企業最高可被罰款全球年營收的多少比例?
根據 AI Act 的規定,對於違反特定條款(尤其是關於禁止的 AI 實踐或高風險 AI 義務)的公司,最高罰款可達全球年營業額的 7% 或 3500 萬歐元,以金額較高者為準。
歐盟人工智慧法案 (AI Act) 中「高風險 AI 系統」的主要適用領域為?
AI Act 將對基本權利或安全構成高風險的 AI 定義為「高風險 AI」,需滿足嚴格要求。典型的高風險領域包括:關鍵基礎設施(如交通)、教育、就業、基本服務(如信貸)、執法、移民、司法、醫療等。娛樂、電商、遊戲開發中的 AI 通常風險較低。
歐盟人工智慧法案 (AI Act) 規範的「透明度義務」適用於哪類 AI?
AI Act 對特定 AI(即使非高風險)施加「透明度義務」,主要是為了告知使用者他們正在與 AI 互動。適用對象包括:與人類互動的 AI(如聊天機器人、個人助理 AI)、情感識別/生物分類系統、生成式 AI(如 Deepfake,需標示內容為 AI 生成)。最低風險 AI 無額外義務。零售 AI 是否需要取決於應用(例如,聊天客服就需要)。選項中生成式 AI 和個人助理 AI 是典型需要透明度義務的類型。(原始答案為 1, 3,此處標記第一個選項 A)
歐盟人工智慧法案 (AI Act) 對「高風險 AI」的主要要求不包括?
對於「高風險」 AI,AI Act 規定了一系列強制性要求,包括風險管理、資料品質、技術文件、記錄保存、透明度、人類監督、強健性、安全性與準確性等。AI Act 並不禁止開發高風險 AI,而是對其開發和部署設定嚴格的合規要求。禁止開發主要針對的是「不可接受風險」的 AI。
在歐盟人工智慧法案 (AI Act) 中,何種 AI 系統屬於「有限風險」類別?
AI Act 的風險分級中,「有限風險」(Limited Risk) 指那些需要履行特定透明度義務的 AI,以便使用者知情。典型的例子就是 AI 聊天機器人 (Chatbots) 和生成虛假內容的 Deepfakes。人臉辨識 AI(某些場景)、醫療診斷 AI 和自動駕駛 AI 通常被視為高風險。
歐盟人工智慧法案 (AI Act) 針對生成式 AI 的規定不包括?
針對基礎模型 (Foundation Models) 和生成式 AI,AI Act 的要求主要包括透明度義務(如提供技術文件、標示 AI 生成內容)、確保訓練資料來源合法(遵守版權法)、對高風險基礎模型進行風險管理等。AI Act 的規定主要是設定合規要求,不直接限制企業的營收。罰款是針對違規行為的後果。
哪類 AI 技術在歐盟人工智慧法案 (AI Act) 內屬於「最低風險」?
「最低風險」(Minimal Risk) 指對公民權利或安全構成很小或沒有風險的 AI 系統,如 AI 驅動的推薦系統(電影推薦)、垃圾郵件過濾器等,基本沒有額外法律義務。自動履歷篩選 AI 和金融信用評分 AI 屬於高風險。深度偽造技術 (Deepfake) 屬於有限風險(需透明度)。
歐盟人工智慧法案 (AI Act) 規定,高風險 AI 的使用者應具備哪些義務?
AI Act 對高風險 AI 的使用者(部署者)規定了責任,包括按照說明操作、確保輸入資料品質(若可控)、監測 AI 系統的運行和輸出結果、保留日誌、實施人類監督等。監測 AI 輸出是使用者的關鍵義務之一。禁止使用針對不可接受風險;免責聲明不足夠;記錄使用者資訊涉及資料保護問題,非 AI Act 對使用者的核心義務。
歐盟人工智慧法案 (AI Act) 針對自動駕駛 AI 的要求為何?
自動駕駛 AI 系統由於直接關係到人身安全,在 AI Act 中通常被視為高風險 AI。因此,它們必須滿足高風險 AI 的所有嚴格要求,其中最重要的之一就是確保高度的安全性、強健性和準確性,這必然要求進行充分的安全性測試和風險評估。
長短期記憶網路 (LSTM) 中的門控機制 (Gating Mechanism) 的主要作用是什麼?
LSTM 中的門控機制(輸入門、遺忘門、輸出門)通過 Sigmoid 激活函數產生 0 到 1 之間的值,這些值像閥門一樣,控制著資訊在 LSTM 單元內部(記憶單元 Cell State)以及單元之間(隱藏狀態 Hidden State)的流動、保留與遺忘。
以下哪一項是迴歸分析 (Regression Analysis) 的主要目標?
迴歸分析 (Regression Analysis) 的主要目標是建立一個模型來描述一個或多個自變數與一個連續的因變數之間的關係,這種關係可以是線性的或非線性的,並可用於預測。找出分群相似實體是聚類 (Clustering) 的目標;檢測垃圾郵件是分類 (Classification) 的目標;建構深度學習模型是一種實現手段。
深度學習神經網路的結構以什麼為基礎?
深度學習中的人工神經網路 (Artificial Neural Network, ANN) 的結構是受到人類(或其他生物)大腦中神經元網路結構和資訊處理方式的啟發而設計的。基本計算單元是人工神經元,模擬生物神經元的連接和處理方式。
人工智慧 (AI) 的特性包括以下哪一項?
人工智慧 (Artificial Intelligence, AI) 旨在模擬人類智能,其展現的特性廣泛,包括但不限於學習能力、推理能力、問題解決能力、感知能力、語言能力以及記憶能力(體現在模型參數、知識庫等方面)。
以下哪一項描述了弱人工智慧 (Weak AI / Narrow AI) 的特性?
弱人工智慧 (Weak AI 或 Narrow AI) 指專注於執行特定任務或解決特定問題的 AI 系統。它們可能在特定領域表現出色,但缺乏通用智能。強人工智慧 (Strong AI 或 Artificial General Intelligence, AGI) 才追求擁有與人類相當的通用智能和完整認知。
機器學習 (Machine Learning) 的主要用途不包括以下哪一項?
機器學習的核心是從資料中學習規律,主要應用類型包括分類 (Classification)、迴歸 (Regression)、聚類 (Clustering)、降維 (Dimensionality Reduction) 和廣義的模式識別 (Pattern Recognition)。「模擬人類感官」是 AI 的宏觀目標,機器學習是實現感官模擬(如圖像分類)的工具,但不是機器學習本身的用途分類。
監督式學習 (Supervised Learning) 的主要特性是什麼?
監督式學習 (Supervised Learning) 的最核心特性是:模型在帶有「標籤」 (Labels) 或已知正確「輸出」 (Outputs) 的訓練資料上進行學習。訓練資料集中的每個樣本都包含輸入特徵和對應的期望輸出。
特徵工程 (Feature Engineering) 的目的是什麼?
特徵工程(Feature Engineering)是指針對原始資料進行處理、轉換、選擇或創造新的特徵,以提高機器學習模型的表現與預測能力。良好的特徵工程能協助模型更有效地學習,進而提升準確率、解釋能力,甚至加快訓練速度。因此,它是資料科學流程中極為關鍵的一環。
| 技術類型 |
說明 |
常見方法 |
特徵選擇 Feature Selection |
從原始特徵中選擇對預測有幫助的子集 |
- 統計檢定(如皮爾森相關係數)
- 遞迴式特徵消除(RFE, Recursive Feature Elimination)
- 基於模型的選擇(例如隨機森林重要性)
|
特徵轉換 Feature Transformation |
將資料轉換為適合模型學習的格式 |
- 標準化(Standardization)
- 正規化(Normalization)
- 對數轉換(Log Transformation)
- 類別編碼(Categorical Encoding):
- One-Hot Encoding
- Label Encoding
- Target Encoding
|
特徵建構 Feature Construction / Extraction |
基於現有資料產生新的有用特徵 |
- 互動特徵(Feature Interaction)
- 時間特徵衍生(如「星期幾」、「是否假日」)
- 地理特徵(如座標轉為距離)
|
缺失值處理 Handling Missing Values |
處理資料中遺漏的值以提升模型穩定性 |
- 平均數 / 中位數 / 眾數補值
- 使用模型預測補值(如 KNN、迴歸)
- 建立缺失標記(Missing Indicator)
|
異常與雜訊處理 Outlier & Noise Handling |
消除或緩解極端值和干擾資料 |
- 離群值移除或替換
- Winsorizing 技術
- 平滑雜訊資料
|
以下哪一項是特徵選取 (Feature Selection) 的主要原則之一?
特徵選取 (Feature Selection) 的目的是挑選出對模型預測效能最有貢獻的特徵子集。評估不同特徵或特徵組合對模型效能(如準確率、AUC等)的影響,是決定哪些特徵應被選取的關鍵依據。選擇全部特徵可能導致維度災難;確保類別平衡是處理不平衡資料的方法;限制資料類型不是通用原則。
根據歐盟人工智慧法案 (AI Act),誰應該對 AI 系統行為負責?
AI Act 旨在明確 AI 系統生命週期中不同參與者的責任。責任通常根據具體情況分攤給:提供者 (Provider,通常指開發者) 對系統設計和合規性負主要責任;使用者 (User / Deployer,部署者) 對按照說明使用、監測系統等負責。AI 系統本身無法負責。因此,開發者和使用者都可能根據情況承擔責任。
什麼是負責任 AI (Responsible AI) 的核心原則?
負責任 AI (Responsible AI) 或可信賴 AI (Trustworthy AI) 旨在確保 AI 的開發和部署符合道德規範。其核心原則通常包括:公平性、透明度與可解釋性、問責制、隱私保護、安全性與強健性、以及人類福祉與價值對齊。「確保安全和公平性」是其中的關鍵核心原則。
負責任 AI (Responsible AI) 的關鍵原則之一是?
「透明性」 (Transparency) 是負責任 AI 的關鍵原則之一。它要求 AI 系統的運作方式、資料使用、決策邏輯等應在一定程度上是可見和可理解的。壟斷市場、限制使用、不考慮公平性都不符合負責任 AI 的原則。
歐盟《人工智慧法案》(AI Act) 採用的核心管理模式是?
A
基於風險 (Risk-Based Approach)
B
基於技術 (Technology-Based Approach)
C
全面禁止 (Total Prohibition)
D
自願遵守 (Voluntary Compliance)
歐盟 AI Act 最核心的管理理念和架構是「基於風險的方法」 (Risk-Based Approach)。該法案根據 AI 系統可能造成的潛在風險水平,將其劃分為不同類別,並施加不同程度的監管要求。
根據歐盟《人工智慧法案》(AI Act),下列哪一類 AI 系統原則上禁止使用?
A
不可接受風險 (Unacceptable Risk)
D
微小或無風險 (Minimal or No Risk)
歐盟 AI Act 將某些被認為對人類構成不可容忍威脅的 AI 應用歸類為「不可接受風險」 (Unacceptable Risk),這些應用原則上是被禁止的。
歐盟《人工智慧法案》(AI Act) 對高風險 AI 系統的主要要求是?
對於被認定為「高風險」的 AI 系統,AI Act 規定了一系列詳細且嚴格的強制性要求,必須在投放市場或投入使用前得到滿足。
下列哪個應用領域的 AI 系統可能被歐盟《人工智慧法案》(AI Act) 視為高風險?
根據 AI Act 列舉的高風險領域,「關鍵基礎設施的管理和運營」(例如水、電、交通等)中使用的 AI 系統被明確視為高風險類別。電玩遊戲、垃圾郵件過濾器通常為最低風險。庫存管理系統通常不屬於高風險。
當使用者與聊天機器人互動時,歐盟《人工智慧法案》(AI Act) 要求告知使用者?
對於與人類進行互動的 AI 系統(如聊天機器人),AI Act 規定了透明度義務,核心要求是使用者應該被明確告知他們正在與一個 AI 系統互動,除非這一點已經很明顯。
根據歐盟《人工智慧法案》(AI Act),「深度偽造」(Deepfake) 的影像內容在公開發布時應?
對於使用 AI 生成或操縱圖像、音頻或視頻內容(Deepfakes)且可能被誤認為真實的情況,AI Act 要求必須清晰地標示該內容是人工生成或操縱的,以提高透明度,防止誤導(除非有合法豁免)。
歐盟人工智慧法案 (AI Act) 主要將 AI 系統依風險劃分為幾個等級?
A
4 級 (不可接受、高風險、有限風險、最低風險)
歐盟 AI Act 採用基於風險的方法,將 AI 系統大致劃分為四個主要風險等級:不可接受風險、高風險、有限風險、最低或無風險。
當模型的預測效果與隨機猜測相同時,AUC 的數值應接近多少?
AUC (Area Under the ROC Curve) 值為 0.5 代表模型區分正負樣本的能力與隨機猜測相當。
根據文件,當模型的預測效果比隨機猜測還差時,AUC 應為下列哪個範圍?
如果模型的預測效果劣於隨機猜測,其 ROC 曲線會位於對角線下方,因此 AUC (Area Under the ROC Curve) 值會小於 0.5。
理論上,AUC 值為 0 代表模型做出了什麼樣的預測?
AUC (Area Under the ROC Curve) 值為 0 表示模型做出了完全相反的預測,即系統性地將所有正樣本預測為負樣本,反之亦然,是一種完全錯誤的預測模式。
在監督式學習 (Supervised Learning) 中,標籤的作用是什麼?
在監督式學習中,標籤 (Label) 代表了每個輸入樣本的已知正確答案或期望輸出。模型透過學習輸入特徵與這些標籤之間的映射關係來進行訓練,標籤用於確定模型應該學習去預測的目標輸出結果。
資料集劃分時,驗證集 (Validation Set) 的主要用途是什麼?
驗證集主要用於在模型訓練過程中調整模型的超參數 (Hyperparameters,如學習率、正規化強度等) 和進行模型選擇(比較不同模型的表現)。模型在訓練集上訓練,在驗證集上評估以指導調優。最終效能評估則使用獨立的測試集 (Test Set)。
資料收集時應注意哪一項以確保 AI 系統的公平性?
為了建構公平的 AI 系統,必須確保訓練資料集能夠充分反映現實世界的多樣性,並能代表所有受影響的群體,避免因資料偏差導致模型產生歧視性結果。
非監督式學習 (Unsupervised Learning) 的主要特性是什麼?
非監督式學習的核心特性是在沒有預先標記的輸出情況下,從資料中發現結構或模式。它不需要監督訊號。最常見的任務是聚類 (Clustering),即將相似的資料點自動分組。使用延遲回饋 (Delayed Reward) 是強化學習的特性。
強化學習 (Reinforcement Learning) 的主要應用場景是什麼?
強化學習 (Reinforcement Learning, RL) 讓智能體透過與環境互動、試錯學習最優策略,特別適用於需要做出一系列決策以達成長期目標的場景,典型的應用包括遊戲(如下棋、電玩)、機器人控制(如行走、導航迷宮)、資源管理等。圖像壓縮是資料處理;客戶細分是聚類;詐騙偵測通常是分類。
「人工智慧」(Artificial Intelligence) 這個術語首次在哪個歷史性會議上被提出?
C
達特茅斯會議 (Dartmouth Conference)
術語「人工智慧」(Artificial Intelligence, AI) 普遍認為是在 1956 年夏天於美國達特茅斯學院舉行的達特茅斯會議 (Dartmouth Conference) 上被正式提出和確立的,標誌著 AI 作為一個獨立研究領域的開端。
哪種類型的 AI 專注於執行特定任務,例如語音辨識或下棋?
專注於執行單一或一組有限的特定任務的 AI 被稱為「狹義 AI」 (Narrow AI) 或弱 AI (Weak AI)。通用 AI (General AI, AGI) 指具備人類水平通用智能的 AI;超級 AI (Super AI) 指智能遠超人類的 AI;情感 AI 側重於處理情感。
艾倫·圖靈 (Alan Turing) 提出的著名測試,用來判斷機器是否能展現出與人類無法區分的智慧行為,稱為?
A
羅森布拉特感知機 (Rosenblatt's Perceptron)
B
中文房間論證 (Chinese Room Argument)
艾倫·圖靈在 1950 年提出的思想實驗,用於判斷機器是否能展現類人智能,被稱為「圖靈測試」 (Turing Test)。如果人類詢問者無法可靠區分與之對話的是人還是機器,則機器通過測試。
深度學習 (Deep Learning) 是哪個 AI 技術領域的一個分支?
深度學習 (Deep Learning) 是「機器學習」 (Machine Learning) 的一個重要分支,使用多層人工神經網路學習資料的多層次表示。機器學習本身是人工智慧 (AI) 的子領域。自然語言處理 (Natural Language Processing, NLP) 和計算機視覺 (Computer Vision, CV) 是 AI 的應用領域。專家系統是早期 AI 的方法。
讓電腦能夠理解、解釋和生成人類語言的 AI 分支被稱為什麼?
B
自然語言處理 (Natural Language Processing, NLP)
D
知識表示與推理 (Knowledge Representation and Reasoning)
專注於讓計算機系統能夠處理和理解人類自然語言的 AI 研究領域被稱為「自然語言處理」 (Natural Language Processing, NLP)。
目前被認為仍處於理論階段,指望機器擁有與人類同等、可在多領域應用的智慧是指?
C
通用人工智慧 (Artificial General Intelligence, AGI)
D
超級人工智慧 (Artificial Superintelligence, ASI)
「通用人工智慧」 (Artificial General Intelligence, AGI),或稱強 AI (Strong AI),指的是具備與人類相當的、全面的認知能力和智能水平的 AI,能夠理解、學習並應用智能於解決任何智力任務。目前 AGI 仍是理論目標。
使電腦能夠從圖像或影片中提取資訊並進行理解的 AI 技術領域是?
B
自然語言處理 (Natural Language Processing, NLP)
「計算機視覺」 (Computer Vision, CV) 是致力於讓計算機能夠"看懂"和解釋圖像或視頻內容的 AI 領域,涉及從視覺資料中自動提取、分析和理解資訊。
AI 的哪個子領域,使系統能夠在沒有明確指令的情況下,從經驗(資料)中學習?
B
符號計算 (Symbolic Computation)
「機器學習」 (Machine Learning) 的根本特點就是讓計算機系統能夠從資料(經驗)中自動學習模式和規律,而不需要針對每個任務進行顯式編程。
下列哪項不是目前狹義 AI (Narrow AI) 的典型應用?
手機人臉解鎖、電商推薦、自動駕駛輔助系統都是目前應用廣泛的狹義 AI(專注特定任務)。「擁有自我意識的機器人」屬於強人工智慧 (AGI) 或科幻範疇,遠超出現有狹義 AI 能力。
下列關於 AUC (Area Under the ROC Curve) 的敘述何者正確?
AUC 值介於 0 和 1 之間,越接近 1 表示模型的區分能力越強,預測效果通常越好。AUC=0.5 等同隨機猜測。AUC 同時考慮真陽性率和偽陽性率。相較於準確率,AUC 對資料類別不平衡較不敏感,但說完全不受影響可能過於絕對。選項 1 是最普遍認同的正確描述。
在二元分類問題中,ROC (Receiver Operating Characteristic) 曲線的橫軸通常代表什麼?
D
偽陽性率 (False Positive Rate, FPR)
ROC 曲線的標準定義中,橫軸 (X-axis) 代表偽陽性率 (False Positive Rate, FPR),即實際為負樣本中被錯誤預測為正樣本的比例 (FPR = FP / (FP + TN))。
在二元分類問題中,ROC (Receiver Operating Characteristic) 曲線的縱軸通常代表什麼?
B
真陽性率 (True Positive Rate, TPR)
D
偽陽性率 (False Positive Rate, FPR)
ROC 曲線的標準定義中,縱軸 (Y-axis) 代表真陽性率 (True Positive Rate, TPR),也等於召回率 (Recall) 或敏感度 (Sensitivity),即實際為正樣本中被正確預測為正樣本的比例 (TPR = TP / (TP + FN))。
根據文件,卷積神經網路 (CNN) 中的哪個層級的主要功能是「降維」?
A
卷積層 (Convolutional Layer)
D
激活函數層 (Activation Layer)
池化層 (Pooling Layer) 通過下採樣操作(如 Max Pooling 或 Average Pooling)來降低特徵圖的空間維度,實現降維。
池化層 (Pooling Layer) 在 CNN 中進行降維的主要目的是什麼?
池化層降低特徵圖的空間解析度,主要目的包括:減少後續層的計算量;減少模型參數數量(間接),有助於防止過度擬合;提高模型對輸入微小平移或變形的強健性(魯棒性),從而提高泛化能力。選項 1 較好地概括了這些核心目的。
下列哪個池化操作常用於 CNN 的降維?
C
批次正規化 (Batch Normalization)
池化 (Pooling) 是 CNN 中常用的降維操作。最常見的池化方法是最大池化 (Max Pooling) 和平均池化 (Average Pooling)。卷積運算是特徵提取;批次正規化是改善訓練的技術;ReLU 是激活函數。
降維技術 (Dimensionality Reduction) 的主要目的是什麼?
降維技術的核心目的是減少資料的特徵數量(維度),以達到降低計算複雜度、緩解維度災難、去除冗餘資訊等目的。改善視覺化效果是其應用之一,但主要目的是減少特徵數。主成分分析 (PCA) 是一種降維方法。
除了池化層,下列哪種方法也常用於降維?
D
主成分分析 (Principal Component Analysis, PCA)
降維的方法包括特徵選擇和特徵提取。主成分分析 (PCA) 是一種非常常用的特徵提取降維方法。池化層是 CNN 中常用的降維方式。增加層數、改變激活函數、調整學習率與降維無直接關係。
權重共享 (Weight Sharing) 是 CNN 的核心技術之一,它主要減少了模型的哪個部分?
權重共享是 CNN 卷積層的關鍵特性,同一個卷積核使用相同的權重滑過輸入的不同位置。這極大地減少了模型需要學習的參數數量,有助於降低模型複雜度、防止過度擬合。雖然也會間接影響計算和時間,但最直接減少的是參數數量。
長短期記憶網路 (LSTM) 中的門控機制 (Gating Mechanism) 的主要作用是什麼?
LSTM 的門控機制(輸入門、遺忘門、輸出門)通過 Sigmoid 激活函數產生 0 到 1 之間的值,這些值像閥門一樣,控制著資訊在 LSTM 單元內部(記憶單元 Cell State)以及單元之間(隱藏狀態 Hidden State)的流動、保留與遺忘。