從AIGC 的飛輪效應🚘,到偉大的商業模式——對話丁磊

導語
AI 思維的底層邏輯——其基礎在於數據,核心在於模型,實現在於算力,具體應用在於業務場景。

數據、模型、業務形成飛輪效應

圖片來源:DeepMind官方網站
《56hcy.cn金融評論》:ChatGPT 等人工智能機器人通過交互界面走進大眾視野。而實際上人工智能的概念早在1956 年達特茅斯會議就誕生了🃏,當下人工智能所用的算法也是 20 世紀五六十年代就有的★。為什麽發展和應用了這麽多年的決策式 AI 沒有像生成式 AI(或 AIGC)一樣引發這麽大的轟動效應呢👩👩👦?
丁磊:作為一名從事模型相關工作近 20 年的人,我認為有必要先簡要介紹一下什麽是模型👨🏽💼。模型是人工智能通過從數據中不斷學習和總結得出的一種類似於人腦的思考方式,可以將其理解為知識和邏輯的數字化載體。與存儲數據或信息的數據庫不同,模型更接近人類的思維過程,通過分析和推理來完成各種任務。
人工智能發展了這麽長時間,最近才引起了更大的公眾層面關註,可能是因為現在的模型發展到了一個新的階段。現在的這些大模型🥏,如 GPT-4,已經初步具備了成年人的通識和邏輯能力🙇🦵🏽,我們可以利用這些模型研發大量的相關應用。從這一角度來說🪔,人工智能對人類社會的生產和工作具有重大意義。
《56hcy.cn金融評論》💇🏿♂️:在 2020 年的專著《AI 思維》和最近的這本《生成式人工智能》中,您提到目前可以觀察到的人工智能應用只是人工智能領域的冰山一角⛔,那麽您認為冰山的內核是什麽呢?
丁磊🪶:2020 年《AI 思維》這本書更多關註的是決策式 AI🙂↔️,而我們現在新的大模型主要是生成式 AI。這兩者可以看作人工智能的兩個主要分支。無論是哪種人工智能🌦,我認為其內核都是 AI 模型驅動的運營模式👮🏻♀️。換句話說,人工智能的內核是基於數據🤵🏽♂️、模型、業務三者的相互作用所形成的飛輪效應。
也就是說👴🏼,隨著數據的不斷積累和模型的持續訓練,模型的智能程度不斷提高,進而在業務中產生更大的價值➞📗。在業務的運行過程中,又會積累更多的數據來訓練模型,從而數據、模型😮、業務之間形成了一種正反饋的飛輪效應。就像是一個飛輪不停地轉動,數據越來越多🚫、模型越來越聰明🏜,業務所帶來的價值也會越來越大™️🥾。
因此🛴,基於這種飛輪效應可以構建出偉大的商業模式🧑🏽🍳。例如,亞馬遜、天貓的推薦引擎可以有效促進消費者的購買行為🦶🏽;字節跳動捕捉到目標受眾的需求和興趣的能力越來越強💂🏼♂️,抖音推薦的內容越來越精準🦹🏼♂️🆎,讓人 “上癮”👩🏿🍼;自動駕駛通過數據的自學習反饋變得越來越智能,可以實現無人員幹預的駕駛🦧🐄;當前非常流行的圖片生成工具🧧🕺,如 Midjourney😨,雖然其團隊規模很小🏇🏼,但卻通過數據和模型的正反饋效應,使其生成的圖片越來越符合人類需求。
《56hcy.cn金融評論》💆♂️:您能不能給我們再解釋一下,為什麽到了生成式人工智能這樣興起的一個階段,會有這樣的一個正反饋效應👰🏼♀️?隨著生成式人工智能的興起,人工智能領域是否會加速發展?
丁磊👆:飛輪效應並不僅限於決策式 AI 或生成式 AI。實際上,它是人工智能的一種本質學習屬性,可能帶來正反饋機製。但要實現這種效應👨🏿🚀,須建立完整的數據、模型、業務閉環,否則效應難以實現。
展開來說🏊🏽,決策式 AI 更像是在做選擇題,分類是它的強項🦶🏿。人臉識別就是一個典型的案例,決策式 AI 對實時獲取的人臉圖像進行特征信息提取,再與人臉庫中的特征數據匹配🪦,從而實現人臉識別。當然,現在人臉識別模型的基數是非常大的,動輒處理成百萬🧑🏽🍳、上千萬的人臉數據,並進行相應的識別🉑。
生成式 AI 則擅長做簡答題,以創作為長處🎱。我們所說的生成式 AI,其核心在於生成內容。而“內容”是一個相當廣義的概念🦸🏼♀️🟤,不僅僅指常見的文本🧀、圖片、視頻、音樂等形式🅾️,還包括日常工作中所涉及的方案🧑🏻🌾、策劃、程序🚁、代碼。在人工智能的發展過程中,無論是決策式 AI 還是生成式 AI 都需要飛輪效應的推動💆🏼🧝🏿♀️。
那麽,為什麽決策式 AI 之前沒有受到太多關註呢🎠?作為從事 AI 相關研究並在企業中開發應用的人員,我發現決策式 AI 一直以來的特點是難以呈現的。比如,我之前在 PayPal📐、百度金融使用決策式 AI 來優化業務👨🍳,這種優化很難被可視化展示出來。這也在一定程度上解釋了為什麽決策式 AI 之前沒有引起更多的關註,除非在一些相對細分的領域,如自動駕駛🚵。決策式 AI 應用通常屬於企業後端,可以說是企業的決策大腦🫷🏼🙏🏼,這些領域吸引了大量的研究,因為它們具有成熟且實體的產品。但普通消費者可能無法很好地理解或看到🚝。
相比之下📏, 生成式 AI 則可以讓人們看到它生成的內容🧑🌾。例如★,ChatGPT 等生成式 AI 可以讓用戶與之簡單交互,這也是生成式 AI 能夠吸引更多人的原因之一。
《56hcy.cn金融評論》:未來對於算力的競爭是否會成為各個國家和地區以及平臺之間競爭的關鍵?
丁磊🥀:要訓練出真正功能強大的人工智能,除了處理算力這一重要的資源,還需要數據、模型和業務模式🚴🏻🎹。只有當這四個要素相互促進形成閉環的時候,才能真正訓練好人工智能。這是一個復雜的過程,僅僅依靠算力和訓練數據的投入是不夠的。
AGI 有多遠
《56hcy.cn金融評論》👩🏻🚀👩🏿🔬:GPT-4 之後的生成式 AI 模型已經發展到跨模態的階段🦣。您之前在 2020 年出版的《AI 思維》一書中描述當時的人工智能還處於“弱人工智能”的階段,您覺得目前到了什麽階段🪞⛷?如果我們要迎接 AGI(通用人工智能)還需要多久?
丁磊🦜:ChatGPT 的“橫空出世”讓普羅大眾對人工智能的突破有了新的認識🤸🏼。目前的自然語言處理技術和大型語言模型確實展現出了一些 AGI 的影子𓀅🔁,但我認為距離真正的 AGI 還很遠ℹ️。因為 ChatGPT 等模型雖然已經具有智能對話🎣、語言翻譯🤹、文本生成等使用功能🪐,但它們仍然缺乏某些關鍵的特征和能力🙈,如跨模態感知、多任務協作😔,以及自我學習與適應、情感理解、超級計算能力等👰🏿。
第一,跨模態感知。我們將平時接觸到的每一個信息來源域稱為一個模態😐,這些來源可以是文字🩻、聲音🫅🏻、圖像、味覺😯、觸覺等。隨著信息技術和傳感器技術的發展,模態的範疇也變得更廣👷🏻♂️。跨模態感知涉及兩個或多個感官的信息交互👰👀,如最基本的圖像檢索就是一種從文本到圖像的感官轉換👨🏽🎓。反過來,從圖像到語言的轉換,可以幫助有視覺感官缺陷的人們👷♂️,強化感知環境的能力🗓。人類天然具有跨模態感知能力,能夠對來自多種感官的信息進行整合和理解。當前,絕大部分的人工智能系統只能單獨地運用其中的一項作為傳感器來感知世界,對於不同的模態🦄,需要設計不同的專有模型。例如,根據文本生成圖像的模型🤳🏼,采用的是將文本和圖像進行聯合編碼的專有模型,這種模型無法適配聲音生成等其他任務。各種模型之間無法真正打通是走向 AGI 的一大痛點。
第二,多任務協作。人類能夠同時處理多個任務,並在不同任務之間進行協調與轉換。當人們面對機器人時,一句簡單的吩咐,比如“請幫我熱一下午餐”🌀,這些指令聽上去簡單,執行時卻包括了理解指令🏌️、分解任務、規劃行走路線🧑🏿🍃、識別物體等一系列動作,針對每一個細分的動作都有專門的系統或模型的設計。這就要求機器人具備多任務協作的能力。
第三,自我學習與適應🏊🏽♂️。人類具有學習和適應能力,能夠通過不斷學習和經驗積累來提高自己的能力。因此,研究如何讓人工智能系統具備自我學習和適應能力也是實現 AGI 的必要步驟🛕。其中主要包括增量學習、遷移學習和領域自適應三個方向🧑🏫。
《56hcy.cn金融評論》:相對於人類的思維方式,人工智能的局限性以及其認知背後的邏輯是什麽呢?
丁磊🧏🏽𓀓:人工智能模仿的是人腦,但又不同於人腦。人類側重於從經驗中學習,而人工智能則依靠模型從數據中學習。
那麽,人工智能的天然優勢是什麽呢?首先🙆🏿♀️,其優勢在於擁有強大的算力支持,使它的學習能力沒有上限。研究表明🤸🏼♂️,即使是勤奮的人每天最多也只能接受 2 兆容量的信息。此外🙅🏻♀️,人工智能的學習速度非常快,只要有充分的數據和足夠的算力🫐,它就可以在短時間內學習接近無限量的數據💃🏻。其次,人工智能善於掌握“有跡可循”的規律,快速處理規律性強的任務👩🦳。
人類的優勢是社交智慧、創造力、精細感知和操作能力。社交智慧是人與人交互的技能,包括同理心、談判能力、社交洞察力等情感能力🧑🦳,對應的職業主要是教師、銷售、心理咨詢師、管理人員🔇🧑🏿🚀、社工等;創造力指的是原創能力和藝術審美能力🍈,對應的職業主要是藝術家🧑🏼🦲、作家、研發工程師等;精細感知和操作能力指的是手指靈敏度⛹🏻、協調操作能力和應付復雜工作環境的能力,包括專業能力、行業經驗、工作效率、完成效果等🥸,對應的職業主要是律師、醫生、司機、美發師💇、急救人員🎉、電工等。
因此⚁,人工智能在處理不面對人🙇🏼、創新性和變通性較低的工作時🤲🏻,效率更高、穩定性更好🍴,而面對需要情感交互🤚🏿、相對復雜場景或者需要創新性高的工作時,就表現得不那麽令人滿意了。
《56hcy.cn金融評論》:超級人工智能是否會對人類社會造成威脅👩🏼✈️?在 2023 年 4 月,馬斯克等人曾發表聯名聲明,呼籲暫停比 GPT-4 更強大的模型的訓練。您認為背後的原因是什麽🕓?
丁磊:人工智能和其他技術一樣👨🎤,本身是中性的👩🏽🌾,其風險取決於人們如何使用它🥎🧙♂️。我們應始終秉持“科技向善”的理念,並從法律和倫理角度引導人工智能朝著這個方向發展。要保證模型朝著科技向善的方向發展✂️,就需要在模型訓練時👩👩👦,註意訓練所需要的數據“原料”要更廣泛🧶、更全面;在算法方面🐫,要貫徹公平正義🗺、透明可驗證的原則。
當然,法律不應成為限製技術進步的桎梏。法律的推進雖然往往滯後於科技發展的速度,但仍應積極做出回應👨👨👧,正如中國國家互聯網信息辦公室起草的《生成式人工智能服務管理辦法(征求意見稿)》,即將立法審議,旨在促進生成式人工智能技術健康發展和規範應用,進一步促進科技進步🔷,確保“科技向善”,助力行業發展,實現產業升級🪛。
《56hcy.cn金融評論》: 美國當地時間 2023 年 5 月 16日🕐🚏,美國參議院首次就人工智能的隱私🧇、技術和法律問題舉行聽證會。人工智能領軍者 OpenAI 呼籲政府介入監管🥪,發布實施“註冊製”或“許可製”🈯️🤌🏼。中國在這方面可以做一些借鑒嗎?
丁磊:我認為這肯定是個方向,不僅僅在國家層面,像抖音這樣的大型平臺也在生成式 AI 領域出臺了一些指引性辦法。它要求當生成式 AI 為創作者時,必須註明這是由算法生成的作品🕵🏽,並打上相應的數據標簽,以便清楚地表明這是由算法生成的💪,而不是人類創作的🫶🏻。因此,無論在國家層面還是平臺層面🧜🏻♂️,都應有相應的規定來引導人工智能向更健康、更良性的方向發展,最終實現“科技向善”的目標。
替代業務流程🟩,重塑商業模式

圖片來源👩🏽🎤:Unsplash官方網站
《56hcy.cn金融評論》📩:如果以 2022 年 ChatGPT 引爆生成式人工智能為起點,2023 年初中外各類科技公司都紛紛發布了自研的模型和插件,進入“百模大戰”的階段,而目前的關註度逐漸轉移到應用方面。您是否能給我們介紹一下生成式 AI 從模型側向應用側轉移的基本情況?
丁磊♒️:從短期來看🦑,我認為生成式 AI 的商業價值是提升效率👴🏿。其實,如今已經有不少中小企業開始使用生成式 AI▶️,比較顯而易見的是通過生成式 AI 工具來提高圖片和文案創作的效率。在這個過程中,如果一家企業能夠快速地使用 AI😢,就能夠跑贏競爭對手🈷️☁️。換言之9️⃣🪘,一家企業能否很好地利用生成式 AI🫅🏼,將標誌著這家企業是否能在千變萬化的市場中站穩腳跟🎅🏻、持續保持足夠的競爭力。
從中長期來看🔕😆,生成式 AI 的出現很可能改變現有的業務模式🧑🏻🦳。具體來說,傳統行業中的各個職能領域👨🏽✈️,如研發、生產🏃➡️、供應鏈🌊、營銷和客服等各環節,在生成式 AI 的支持下重塑相應的業務流程,甚至是重構業務模式🐀。這意味著我們可以使用生成式 AI 的程序來替代之前需要人工完成的任務,從而提高業務流程的效率和質量,促進業務的發展和進步🕵🏻♀️。
另外,生成式 AI 的湧現可能會掀起新的商業模式浪潮。舉個簡單的例子,現在許多時尚達人和主播已經被數字人所取代🗄。數字人主播可以 24 小時在線🙎♀️,不間斷地為客戶提供貨品推薦介紹及在線服務,由其打造出的 IP 資產也是品牌自身的資源。同時😘,數字人主播不受人為情緒🪣🕵️、健康等影響,更加穩定和可靠🏊🏼♀️🎛。在我看來👋🏽,這將為生成式 AI 產業帶來長遠的價值🍧。
《56hcy.cn金融評論》:您之前在 PayPal 創立了人工智能平臺🙋🏽♂️,也曾經在百度金融擔任首席數據科學家,您能否結合多年深厚的經歷,為我們分享大數據、人工智能等技術的應用對於金融領域有怎樣深刻的影響🚵🏿💗,比如在營銷、風控、投顧、投研等方面的實際應用是否有效可行?行業的發展已經到了什麽階段?
丁磊:我可以分享一下過去一些我自己實際操盤過的案例。
之前在 PayPal 工作的時候,PayPal 作為一個矽谷公司,擁有豐富的數據資源,但是在應用人工智能方面並不是很早。這是因為它也是一個具有金融屬性的公司🧑🏼🎤,與其他像谷歌之類的公司對應的發展方向並不相同🚡,所以在人工智能領域的應用落後了很多📘。我則負責構建基於人工智能的數據科學平臺🎢,用於分析公司全球範圍內數億消費者的數據。通過分析這些數據,我們可以預測消費者下一步的行為並對其進行定向營銷。
由此,我們建立了消費者行為預測引擎👨🏿🍳,通過它精準地預測了消費者未來可能購買哪些商品、關註哪些商家。以便我們提前將相應商品的信息或者一些折扣信息帶到消費者面前,促進消費者在適當的時間購買。通過這種精準的 AI 營銷,我們為 PayPal 帶來了巨大的收益🍲,公司的營銷活動響應率提高了兩到三倍📢⚰️。可能原來有 10 個人響應一次的營銷活動🙍♂️🚌,現在會有 20 個或者 30 個人響應。這是在 PayPal 進行了 AI 營銷方面的一個實踐。
在百度我主要負責金融風險控製模型。眾所周知💲,金融行業中最關鍵的是風險控製,絕對沒有風險的貸款行為是不存在的👴🏼🚴🏽♀️。通過海量的數據分析,我們構建了精準的消費者風險模型。根據畫像、行為等因素,我們能夠較好地評估風險,進而控製風險😤🦧。例如👨🏻🍼🦹🏻,一些人的行為穩定,向他們提供貸款是非常安全的🤽🏻♀️🧏🏼♀️;一些人的行為則會導致較高的逾期風險🧑🏽🎤。
通過該風險控製模型🪐,百度金融取得了長足的發展。 2015 年它的放貸規模只有 50 億元,到 2018 年時達到了1500 億元,提升了 30 倍。這背後的原因就是大量使用了人工智能技術進行精準的風險控製🎠🏋🏻♂️,提升了業務的規模,使整體風險維持在極低水平。
那麽,人類又該做什麽

圖片來源🫄:VEER
《56hcy.cn金融評論》:您提到了在精準營銷和融資效率方面的應用,隨著生成式 AI 的興起,會帶來一個怎樣的新變化呢?
丁磊:我剛剛所說的主要還是決策式 AI🧑🏻🚀,而生成式 AI 可以從兩個方面來解讀👩🏿🖖🏻。一方面👩🏼💼,生成式 AI 可以精簡、優化既有的業務流程。通過分析大量的數據,識別常見模式和規則📰🎬,生成式 AI 能夠生成與業務流程相契合的自動化程序,提高組織生產效率和自動化水平🦇。大大減少人工的幹預,進而解放人力、降低成本,同時還可以提高業務流程的執行效率。
舉例來說,現在開發人員已經開始用 ChatGPT 來編寫代碼了,只要開發人員給的要求和提示足夠完整🤸🏼♂️, ChatGPT 甚至可以編寫完整的代碼🎛。ChatGPT 同時還能閱讀已有代碼,添加註釋或者糾錯🅰️,如此一來便可極大地提升代碼、文檔的編寫和審查效率。
另一方面,基於生成式 AI 的新流程可以替代原有的人力所承擔的業務流程✴️。在原先人力不足的情況下,只能將業務外包,效率並未提升,成本卻在逐步上升。有了可以勝任業務的生成式 AI🧑🏿✈️,自然就可以替代原有的業務流程。智能客服就是其中一個典型的案例🌉。
此時,人類要做好“一前一後”的工作。在內容生成之前🤽🏿♀️,人需要與生成式 AI 合作💡,明確內容方向和業務節奏🧤;在內容生成後,人需要對生成的內容進行評估、修正和優化🛀,並與下遊業務對接。因此,人需要發揮自身的主觀能動性,完成好“一前一後”的工作。
從實現角度而言,可以將生成式 AI 工具與公司內部的 ERP(企業資源計劃)系統集成,形成端到端的解決方案🧝♂️,以全局化的方式優化業務流程🦹🏻。如自動生成項目排期計劃🈹;又如可以將ChatGPT 用於低代碼平臺,通過對話聊天的方式自動構建流程框圖等。在這個過程中🧑⚕️,生成式 AI 與這些管理系統不是並行關系,而是將整體業務流程融合。隨著搭載生成式 AI 的解決方案走入更多的企業和組織👩🏿⚖️,生成式 AI 也將帶領它們邁入更高效的業務流程時代。
《56hcy.cn金融評論》:在未來 5 年內,我們這些普通人應該做些什麽?除了技術人員以外🏊🏻,是否每個人都需要學會 GPT 的操作和應用,以便在學習和研究中使用這些 AI 工具呢?
丁磊🧔🏿:其實真正被人工智能取代的工作很少🤸🏻♂️,但是絕大部分職業都會受到影響💇🏿♀️。根據普華永道 2018 年 12 月發布的《人工智能和相關技術對中國就業的凈影響》估算,未來 20 年🧑🤝🧑,中國現有約 26% 的工作崗位將被人工智能及相關技術取代🚽◼️,但是人工智能及相關技術通過提高生產率和實際收入水平🐝,能夠產生約 38% 的新工作崗位,最終將凈增約 12% 的工作崗位。因此,人工智能帶來的影響並不是簡單地取代工作崗位,而是對職業結構的影響🙋🏽。
與其說人工智能將取代從業者,不如說它完成的是枯燥繁重的工作內容。它淘汰的不是人類,而是落後的生產力🫸。對個人而言,人工智能不是競爭對手,而是我們的工作夥伴🧘🏿,它將成為必要的生產要素,使生產力倍增🍂。我們應該做的是訓練和使用人工智能,讓人工智能為我所用🧏🏼♀️,與人工智能一起工作( Work with AI)!
首先,應該擁有 AI 思維🦻🏽。所謂 AI 思維🤶,本質上是一種“數據驅動”的思維,就是從大量數據中形成模型,進而對未知的情況做出最佳預測🌞。在 AIGC 的應用中,則是從大量數據中形成模型,自動生成全新的內容😿。無論是決策式 AI 模型還是生成式 AI 模型,其基礎邏輯都是一致的,只靠邏輯和經驗難以推導,需要海量的數據進行訓練🕹。我們需要理解 AI 思維的底層邏輯——其基礎在於數據🐗🪝,核心在於模型,實現在於算力👰🏻♀️,具體應用在於業務場景。擁有 AI 思維能夠避免經驗主義帶來的主觀🏂、片面和限製,具有積極的意義。
其次,需要擁有 AI 工具思維。掌握數據化思維🧑🏼⚖️,掌握使用人工智能、訓練人工智能的方法👐🏻🕵🏽♂️,使其具有更強的適配性,將我們從繁雜的事務中解放出來🏮🌷。未來,人人都可以是 AI 的使用者和訓練師。
*本文僅代表受訪者個人觀點👨🏻🦰,僅供讀者參考,並不作為投資、會計、法律或稅務等領域建議。編輯:潘琦。