2025年AI再進化

文：達達 | 圖：網絡圖片

AI有幾勁，相信都唔需要達達再多講。ChatGPT讓人逐漸喪失寫作能力，而短影音於10多秒內就直接跳到結論，中間過程直接略過，對人的影響不僅是專注時間縮短，甚至會影響認知與思考能力。AI成為歷史上最具顛覆性的力量，最終可能會令每個地球人都失業。

近期就有中國商家利用AI技術偽造名人直播帶貨，不但影象真實、聲音更難分真偽，甚至成功售賣了1,200件商品。如今只需輸入一段文字，AI就能自動生成具有立體感的圖像、影片，以至同步產出相應旁白或音樂，甚或協同多種模型，自動完成複雜任務。

多模態大模型

展望2025年發展方向，AI業界表示，「多模態大模型」與「AI Agent協同技術」將成為引領未來發展的關鍵技術。以往必須依賴不同的模型或工具，才能分別處理文字、圖像、聲音和影片，而「多模態大模型」技術突破大幅降低內容創作的門檻，能將所有功能一統整合，令用戶僅透過日常語言就能創造圖像、音樂或影片，甚至生成3D模型。

初創企業與垂直領域公司也紛紛推出創新應用。以內容創作和娛樂領域為例，AI音樂讓使用者只需輸入曲風、情感、速度等關鍵詞就能自動生成完整曲目，還能根據影片或圖像氛圍進行調整。企業將AI技術用於虛擬主播或客服行銷，教育機構亦可快速製作線上課程。

大管家「AI Agent」

目前，AI已能直接操作使用者的電腦、整理檔案或啟動軟件，甚至連結多平台之間的雲端帳號，在多個系統間協同工作。在金融、法律、醫療、程式設計等專業領域中，這些模型不僅能快速閱讀、歸納龐大資料，也能主動提供分析建議，自動完成複雜任務。「AI Agent」能協同、決策與執行，同時能整合多個模型，如文字生成、圖像識別、聲音合成等與第三方API（雲端服務、CRM、行銷平台等），協調並管理一連串自動化流程。

全球各大科技巨頭與初創公司今年紛紛佈局。OpenAI後續推出的GPT-o1及o3，不但在圖像與文字生成的品質上向前躍進，更讓AI的推理與理解能力直迫高等學府的博士水平。Google則在搜尋與協同作業工具中，大量導入名為Gemini的多模態模型。蘋果則利用自家硬件生態系的優勢，鎖定「個人化AI」並推出Apple Intelligence，主打隱私保護與操作便利的語音服務、健康管理等功能。

隨著AI應用範圍擴大，一方面需加強AI監管力度，特別是在數據隱私、透明度和內容審核等方面。另一方面，企業需要在技術創新與合規要求之間尋求平衡，同時應對日益增長的資訊安全威脅。

大裁員時代

知名諮詢顧問公司麥肯錫（McKinsey & Company）於2023年發表的一份報告指，橫跨各行各業有大約七成職位，將會逐步被AI取代。McKinsey於2024年亦身先士卒裁撤大中華地區360名來自設計、數據工程、雲端與軟體等多部門員工。

新一年，新氣象。雖不宜放負，但對於未來的職場發展，所有地球人都需要重新思考。

如有任何關於理財保險的問題，可直接聯絡：

達達，於銀行任職，加拿大持牌理財保險顧問

Taktak.financialfreedom@gmail.com

免責聲明

本文為筆者個人見解。內容為一般資訊交流及意見分享，不適用於個別具體情況，亦不旨於提供任何指導性建議。本文內容不能用於替代專業會計、稅務、法律、保險專家或其他專業人士提供的諮詢意見。如有具體問題需要協助，請諮詢相關的專業人士。儘管筆者盡可能確保資訊準確，但不會就任何資訊的誤差負任何法律責任。

2025年AI再進化

最新文章

Comments