top of page
KongED2

2025年AI再進化

文:達達 | 圖:網絡圖片

AI有幾勁,相信都唔需要達達再多講。ChatGPT讓人逐漸喪失寫作能力,而短影音於10多秒內就直接跳到結論,中間過程直接略過,對人的影響不僅是專注時間縮短,甚至會影響認知與思考能力。AI成為歷史上最具顛覆性的力量,最終可能會令每個地球人都失業。


近期就有中國商家利用AI技術偽造名人直播帶貨,不但影象真實、聲音更難分真偽,甚至成功售賣了1,200件商品。如今只需輸入一段文字,AI就能自動生成具有立體感的圖像、影片,以至同步產出相應旁白或音樂,甚或協同多種模型,自動完成複雜任務。


多模態大模型

展望2025年發展方向,AI業界表示,「多模態大模型」與「AI Agent協同技術」將成為引領未來發展的關鍵技術。以往必須依賴不同的模型或工具,才能分別處理文字、圖像、聲音和影片,而「多模態大模型」技術突破大幅降低內容創作的門檻,能將所有功能一統整合,令用戶僅透過日常語言就能創造圖像、音樂或影片,甚至生成3D模型。


初創企業與垂直領域公司也紛紛推出創新應用。以內容創作和娛樂領域為例,AI音樂讓使用者只需輸入曲風、情感、速度等關鍵詞就能自動生成完整曲目,還能根據影片或圖像氛圍進行調整。企業將AI技術用於虛擬主播或客服行銷,教育機構亦可快速製作線上課程。


大管家「AI Agent」

目前,AI已能直接操作使用者的電腦、整理檔案或啟動軟件,甚至連結多平台之間的雲端帳號,在多個系統間協同工作。在金融、法律、醫療、程式設計等專業領域中,這些模型不僅能快速閱讀、歸納龐大資料,也能主動提供分析建議,自動完成複雜任務。「AI Agent」能協同、決策與執行,同時能整合多個模型,如文字生成、圖像識別、聲音合成等與第三方API(雲端服務、CRM、行銷平台等),協調並管理一連串自動化流程。


全球各大科技巨頭與初創公司今年紛紛佈局。OpenAI後續推出的GPT-o1及o3,不但在圖像與文字生成的品質上向前躍進,更讓AI的推理與理解能力直迫高等學府的博士水平。Google則在搜尋與協同作業工具中,大量導入名為Gemini的多模態模型。蘋果則利用自家硬件生態系的優勢,鎖定「個人化AI」並推出Apple Intelligence,主打隱私保護與操作便利的語音服務、健康管理等功能。


隨著AI應用範圍擴大,一方面需加強AI監管力度,特別是在數據隱私、透明度和內容審核等方面。另一方面,企業需要在技術創新與合規要求之間尋求平衡,同時應對日益增長的資訊安全威脅。


大裁員時代

知名諮詢顧問公司麥肯錫(McKinsey & Company)於2023年發表的一份報告指,橫跨各行各業有大約七成職位,將會逐步被AI取代。McKinsey於2024年亦身先士卒裁撤大中華地區360名來自設計、數據工程、雲端與軟體等多部門員工。


新一年,新氣象。雖不宜放負,但對於未來的職場發展,所有地球人都需要重新思考。


如有任何關於理財保險的問題,可直接聯絡

達達,於銀行任職,加拿大持牌理財保險顧問

 


免責聲明

本文為筆者個人見解。內容為一般資訊交流及意見分享,不適用於個別具體情況,亦不旨於提供任何指導性建議。本文內容不能用於替代專業會計、稅務、法律、保險專家或其他專業人士提供的諮詢意見。如有具體問題需要協助,請諮詢相關的專業人士。儘管筆者盡可能確保資訊準確,但不會就任何資訊的誤差負任何法律責任。

8 次查看0 則留言

最新文章

查看全部

Comentarios


bottom of page