美女脱了内裤张开腿让女人添软件,性XXXX欧美老妇胖老太性多毛

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題

發(fā)表時間：2024-12-24 10:23:21

文章作者：小編

瀏覽次數(shù)：

歷史上第一次有公司會連續(xù)開 12 天的產(chǎn)品發(fā)布會——當 OpenAI 宣布這個決定之后，全球科技圈的期待值被拉滿了。但直到發(fā)布會接近尾聲，「就這？就這？」一位 AI 從業(yè)者如此表達他的觀感。

這似乎代表了某種主流看法：此次 OpenAI 發(fā)布會，亮點不大、低于預期。

前十一天，OpenAI 的發(fā)布會涉及技術、產(chǎn)品形態(tài)、商業(yè)模式和產(chǎn)業(yè)生態(tài)等多個重要更新，包括完整的推理模型 o1、強化微調(diào)、文生視頻 Sora、更強的寫作和編程工具 Canvas、與 Apple 生態(tài)系統(tǒng)的深度整合、語音和視覺功能、Projects 功能、ChatGPT 搜索、給 ChatGPT 打電話和 WhatsApp 聊天等等。

但正如上述 AI 從業(yè)者感到失望的原因，「還以為會發(fā) GPT-5?！乖诎l(fā)布會結束第二天，據(jù)外媒報道，OpenAI 的 GPT-5 研發(fā)受阻。

不過，最后一天發(fā)布的 o3 是個例外。它是 o1 的下一代推理模型，在數(shù)學、代碼、物理等多項測試中表現(xiàn)驚人——一位國內(nèi)大模型公司的技術人士談及 o3 給他帶來的震撼，「AGI 已來?！顾f。技術人士對 o3 評價都頗高。

回顧這 12 天的發(fā)布會，OpenAI 一邊秀出了技術「肌肉」，另一邊不斷優(yōu)化產(chǎn)品形態(tài)、擴大落地應用的空間。有人打趣道，就像一場「直播帶貨」，OpenAI 希望吸引更多用戶、開發(fā)者使用 ChatGPT。在新的一年，OpenAI 在日活、營收等數(shù)據(jù)上或許會迎來飛躍。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖1)

o3 發(fā)布會｜圖片來源：OpenAI

但這個過程不一定會順利。盡管模型能力變強，但由于數(shù)據(jù)掣肘、封裝能力、模型成本過高等原因，強大模型和應用落地之間仍有較大距離。

OpenAI 此次發(fā)布會似乎透露出這樣一種趨勢：目前大模型行業(yè)的競爭焦點不僅在于模型參數(shù)和技術上限，也在于用戶體驗和市場規(guī)模。需要兩者齊頭并進，才能保持領先。

在梳理了 OpenAI 這 12 場發(fā)布會的主要信息、以及與國內(nèi)大模型行業(yè)人士交流后，極客公園總結了以下幾個關鍵看點。

01 o3 的智能深度已經(jīng)夠了，但能否稱之為 AGI 要看智能廣度

「瘋狂，太瘋狂了。」這是國內(nèi)某模型負責人看到 o3 之后的第一反應。

在數(shù)學、編碼、博士級科學問答等復雜問題上，o3 表現(xiàn)出了超越部分人類專家的水平。比如，在涉及生物學、物理學和化學的博士級科學考試 GPQA Diamond 中，o3 的準確率達到 87.7%，而這些領域的博士專家只能達到 70%；在美國 AIME 數(shù)學競賽中，o3 取得 96.7 分、只錯了一道題，相當于頂級數(shù)學家的水平。

被廣為討論的是其代碼能力。在目前全世界最大的算法練習和競賽平臺 Codeforces 上，o3 得分為 2727 分、相較 o1 提升了 800 多分，相當于位列 175 名的人類選手。甚至，它超過了 OpenAI 的研究高級副總裁 Mark Chen（得分 2500 分）。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖2)

o1-preview、o1、o3 的代碼能力對比 | 圖片來源：OpenAI

自 9 月推出 o1-preview 版本以來，短短三個月時間內(nèi)，o1 系列模型在推理能力上完成了超強進化。在發(fā)布會第一天推出的 o1 完整版，其思考速度較 o1-preview 提高了約 50%、針對困難現(xiàn)實問題的重大錯誤減少了 34%、同時還支持多模態(tài)輸入（可識別圖像）。而今天的 o3 在復雜問題上則已超越部分人類專家水平。

「從 o1 到 o3 是通過增加推理計算量實現(xiàn)對模型能力的提升，隨著國內(nèi)外 Deepseek-R1、Gemini 2.0 Flash Thinking 等發(fā)布，表明大模型開始從預訓練 Scaling Law 轉向推理的 Scaling Law?！?/span>清華大學長聘副教授、面壁智能發(fā)起人劉知遠對極客公園表示。

自 OpenAI 發(fā)布 o1-preview，大模型浪潮的技術范式從最初的預訓練 Scaling Law（縮放定律），即不斷擴大模型訓練參數(shù)、提升其智能上限，切換到了新一輪的、升級的技術范式，即在推理階段注入強化學習、提高復雜推理能力。

在前一種范式下，模型主要是通過 next token prediction（下一個詞預測）給出答案，更偏向「快思考」。就像「讀了萬卷書」，但「學而不思則罔」，沒法完成數(shù)學、編程等更復雜的推理任務。

而在后一種范式下，模型不會馬上給出答案，而是會「慢思考」，先引入 CoT（思維鏈），把復雜的問題規(guī)劃、分解為更簡單的步驟，最后得到結果。而當方法不起作用時、它會嘗試另一種方法，在強化學習中提升復雜推理能力——隨著模型不斷進行「慢思考」和強化學習，其推理能力會指數(shù)級上升，這就是推理的 Scaling Law。

對于 o3 超出人類專家的超強研究推理能力——在劉知遠看來，這表明 o3 正在朝「超高智能的超級計算機」方向前進。

不少行業(yè)人士認為，這會對前沿科學領域影響深遠。從積極的角度來看，o3 極強的研究推理能力，能夠幫助推動人類在數(shù)學、物理學、生物學、化學等學科的基礎科學研究。不過，也有人擔心它會沖擊科研人員的工作。

此次 o3 帶來的驚人的智能深度，似乎讓人看到了 AGI 的曙光。但在劉知遠看來，正如信息革命的標志并非大型計算機、而是個人計算機（PC）的普及，只有實現(xiàn) AGI 的大眾化、普惠化，即讓每個人擁有自己的大模型、解決好自己日常的問題，才意味著真正的智能革命。

「畢竟我們并不需要讓陶哲軒、Hinton（均為頂尖科學家）來為我們解決日常問題?！顾f。

這背后涉及的關鍵問題是，o3 模型的智能深度能否泛化到其他各種領域、具有足夠的智能廣度——在上述某國內(nèi)大模型公司的技術人士看來，只有同時突破智能的深度、廣度，才能稱之為 AGI。他對此感到樂觀，「就像你們班來了一個轉校生，你沒跟他接觸過，但他考試數(shù)學和編程都考了全班第一。你覺得他語文和英語會很差嗎？」

對于國內(nèi)的大模型公司來說，核心的問題還是如何追趕 o3。從訓練架構、數(shù)據(jù)、訓練方法和評價數(shù)據(jù)集等關鍵要素來看，這似乎是工程化能解決的問題。

「你認為距離我們擁有一個 o3 水平的開源模型還有多遠？」

「一年之后。」上述模型負責人回答。

02 模型只是發(fā)動機，關鍵是幫助開發(fā)者用起來

盡管 o3 的模型能力很強，但在一些應用層人士看來，模型和落地應用之間還有很大距離?！附裉?OpenAI 訓練了愛因斯坦，但如果想變成上市公司的首席科學家，依然是有距離的?！篂懘a科技創(chuàng)始人兼 CEO 周健對極客公園表示。

作為大模型中間層，瀾碼科技是國內(nèi)較早探索將大模型應用落地、打造 AI Agent 的公司。在周健看來，大模型只是一個基礎設施，需要結合場景去做很多工作才能用起來，而目前主要的掣肘是數(shù)據(jù)。

在很多場景里，拿到完整數(shù)據(jù)是很難的，有很多數(shù)據(jù)甚至是沒有數(shù)字化的。比如獵頭可能需要簡歷數(shù)據(jù)，但很多簡歷數(shù)據(jù)并沒有被數(shù)字化。

而成本是影響 o 系列模型落地的最關鍵因素。根據(jù) ARC-AGI 測試標準，o3-low（低計算量模式）每個任務耗費 20 美金，o3-high（高計算量模式）每個任務耗費數(shù)千美金——哪怕問一個最簡單的問題，也要花費近兩萬元。收益和成本根本不能打平，o3 的落地可能還需要漫長一段時間。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖3)

o 系列模型的成本測算 | 圖片來源：ARC-AGI 測試標準

在幫助模型應用落地的問題上，OpenAI 在發(fā)布會上也發(fā)布了相應的功能方案。比如第二天，OpenAI 專為開發(fā)者發(fā)布了 AI 強化微調(diào)（AI Reinforcement Fine-Tuning）功能，這是周健最關心的功能。它指的是，模型能通過少量數(shù)據(jù)，優(yōu)化推理能力、提升性能。

這尤其適用于精細化領域的應用。OpenAI 技術人士稱，它能幫助任何需要在 AI 模型方面擁有深厚專業(yè)知識的領域，比如法律、金融、工程、保險。一個例子是，最近湯森路透使用強化微調(diào)來微調(diào) o1-mini，得到了好用的 AI 法律助理，幫助他們的法律專業(yè)人員完成了一些「最具分析性的工作流程」。

比如第九天，o1 模型終于向開發(fā)者開放使用。它支持函數(shù)調(diào)用和視覺能力；引入了 WebRTC，實現(xiàn)實時語音應用開發(fā)；推出了偏好微調(diào)功能，幫助開發(fā)者定制模型；發(fā)布了 Go 和 Java SDK，讓開發(fā)者可快速上手集成。

同時，它帶來了更低成本、更高質量的 4o 語音模型。其中，4o 音頻價格下調(diào) 60%，降至輸入 $40/百萬 tokens、輸出 $80/百萬 tokens，緩存音頻價格降低 87.5%、至 $2.50/百萬 tokens；對于預算有限的開發(fā)者，OpenAI 推出 GPT-4o mini，音頻費用僅為 4o 的四分之一。

這個新功能也是周健關注的。他認為，更新的實時語音、視覺識別等功能，將能更好地在營銷、電話客服和銷售外呼等場景應用。按他的經(jīng)驗，當 OpenAI 推出某些領先技術，一般國內(nèi) 6-12 個月就可以追上。這讓他對新一年的應用業(yè)務充滿信心。

03 Sora 的視頻生成低于預期，但產(chǎn)品開放會提升其物理模擬能力

年初 OpenAI 發(fā)布 Sora 的 demo 時，引發(fā)了全球科技圈的震撼。但這一整年，國內(nèi)各大模型公司紛紛競逐文生視頻賽道——等到 OpenAI 在發(fā)布會第三天正式放出 Sora 時，國內(nèi)的文生視頻公司松了一口氣。

「基本沒有什么超出預期的內(nèi)容，真實感、物理特性等方面相比于 2 月份的發(fā)布并沒有顯著變化，從基礎模型能力的層面來說算是低于預期的?！股鷶?shù)科技聯(lián)合創(chuàng)始人兼 CEO 唐家渝對極客公園表示。

目前，字節(jié)、快手、MiniMax、智譜、生數(shù)、愛詩等公司均推出了自己的文生視頻產(chǎn)品。「Sora 的效果和實力綜合來看并無明顯領先優(yōu)勢，我們看到自己與OpenAI確實還是齊頭并進的。」唐家渝表示。

在他看來，Sora 稍微有亮點的部分是在基礎的文生視頻、圖生視頻以外，提供了一些提升視頻創(chuàng)作體驗的編輯功能，說明 OpenAI 確實更關注產(chǎn)品體驗了。

比如故事板功能，它相當于按時間軸的方式，把一段故事（視頻）切成了多個不同的故事卡（視頻幀)。用戶只需要設計和調(diào)整每張故事卡（視頻幀)，Sora 會自動把它們補成一段流暢的故事（視頻）——這很像電影里的分鏡、動畫的手稿，當導演畫好分鏡、漫畫師寫好手稿、一個動畫、片子就做好了。它能讓創(chuàng)作者更好地表達自己。

此外，它還推出了文字直接修改視頻、無縫融合兩段不同的視頻、給視頻改變畫風等功能，它們相當于是直接給視頻加「特效」了。而一般的文生視頻產(chǎn)品，無法直接修改原視頻，只能不斷調(diào)整 prompt（提示詞）、生成新視頻。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖4)

Sora 的故事板功能 | 圖片來源：OpenAI

在唐家渝看來，這些功能設計確實都是為了給創(chuàng)作者更大的創(chuàng)作自由度，類似的功能已經(jīng)在 Vidu（生數(shù)科技的文生視頻產(chǎn)品）迭代的計劃中?！窼ora 這些功能的實現(xiàn)對于我們來說并沒有難度，實現(xiàn)路徑也已經(jīng)非常明確了。」他說。

在發(fā)布會上，Sam Altman 闡釋了做 Sora 的原因：一是工具性價值，為創(chuàng)意人員提供創(chuàng)作工具；二是交互價值，大模型不應只通過文本交互，也應擴展多模態(tài)；三是最重要的——它和 AGI 技術愿景是一致的，Sora 在學習更多關于世界的規(guī)律，最終有可能建立理解物理規(guī)律的「世界模型」。

在唐家渝看來，目前 Sora 生成的視頻中，依然有不少明顯違背物理定律的地方，跟 2 月的 demo 相比進步不大。在他看來，Sora 發(fā)布后、會有更多人來嘗試和探索它的物理模擬能力，這些測試樣本或許對提升它的物理模擬起到一定的指導作用。

04 內(nèi)加功能、外接生態(tài)，ChatGPT 能變成 Super App 嗎？

在 o 系列模型、Sora、以及開發(fā)者服務之外，OpenAI 在發(fā)布會上的主要動作，一方面還是在產(chǎn)品側持續(xù)增加新功能，優(yōu)化用戶體驗。另一方面是積極推動與蘋果等企業(yè)的深度合作，探索 AI 融入終端設備和操作系統(tǒng)。

從前者可以看到，ChatGPT 的演進方向，似乎是要成為一個「無所不能、無所不在、人人可得」的超級 AI 助理。據(jù)極客公園了解，OpenAI 創(chuàng)立之初的愿景就是打造一個「無所不能」的 Agent，它能理解人類的指令、自動調(diào)用不同的工具、滿足人類的需要?？雌饋恚K點即起點。

比如第六天，ChatGPT 增加了支持屏幕共享的視頻通話和圣誕老人語音模式。前者讓用戶能與 AI 實時視頻通話，分享屏幕或展示周圍環(huán)境，進行多模態(tài)互動，復現(xiàn)了電影《Her》的場景。

比如第八天，ChatGPT 向全體用戶開放了其搜索功能。在基礎搜索外，它還增加了語音搜索；同時，它集成了手機設備的地圖服務，能調(diào)取蘋果、谷歌地圖展示搜索結果列表；它還與多家頂級新聞和數(shù)據(jù)提供商建立了合作關系，支持用戶查看股票行情、體育賽事得分、天氣預報等信息。

又比如第十一天，ChatGPT 宣布擴展了與桌面軟件的集成。它能接入更多編碼應用程序，如 BBEdit、MatLab、Nova、Script Editor 等；它能和 Warp（文件共享應用）、XCode 編輯器等應用一起使用；它還能在語音模式下與其他應用程序協(xié)同工作，包括 Notion、Apple Notes 等；

現(xiàn)場演示有這樣一個例子，當用戶在 Apple Notes 中設定「節(jié)日派對歌單」，并語音征詢 ChatGPT 對候選歌曲的意見。ChatGPT 能指出用戶的錯誤，如將圣誕歌曲《Frosty the Snowman》誤寫為《Freezy the Snowman》。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖5)

ChatGPT 指出了 Apple Notes 的錯誤 | 圖片來源：OpenAI

「ChatGPT 會從單純的會話助手向更為強大的代理工具轉變?！?/span>OpenAI 首席產(chǎn)品官凱文·韋爾（Kevin Weil）稱。

而另一方面，OpenAI 也在積極擴張生態(tài)，通過融入人們最常用的終端設備、操作系統(tǒng)、上層軟件等，觸達更廣泛人群。

比如第五天，ChatGPT 宣布集成蘋果智能生態(tài)，融入 iOS、MacOS 和 iPadOS，支持用戶跨平臺、跨應用調(diào)用 AI 能力，包括 Siri 交互、寫作工具（Writing Tools），以及視覺功能智能識別場景內(nèi)容（Visual Intelligence）等。通過這次合作，ChatGPT 觸達了全球數(shù)十億蘋果用戶。它也開啟了大模型與端側、操作系統(tǒng)合作的先例。

比如第十天，ChatGPT 公布了自己的電話聯(lián)系方式（1-800-242-8478），美國用戶每月可撥打該號碼享受 15 分鐘的免費通話。同時上線的還有 WhatsApp 聯(lián)系人（1-800-242-8478），全球任何用戶均可通過 WhatsApp 向該號碼發(fā)送消息，目前只限文字信息。

從 OpenAI 12 天發(fā)布會里，我們看到了行業(yè)的四個關鍵問題(圖6)

ChatGPT 公布了自己的電話聯(lián)系方式 | 圖片來源：OpenAI

全球部分國家、地區(qū)的智能手機和移動互聯(lián)網(wǎng)滲透率還遠遠不足，通過電話這種最基礎的通訊工具，ChatGPT 觸達了這些人群。同時它也通過 WhatsApp，觸達了其近 30 億用戶。

無論是內(nèi)加功能、還是外接生態(tài)，ChatGPT 核心是希望產(chǎn)品觸達更廣泛人群，變成真正的 Super APP。但也有人并不看好它這種不斷內(nèi)加功能、將業(yè)務線拉得無盡長的做法，甚至將其形容為「鋪了一個大餅，但每一塊餅都有點薄，深入不下去」。而很多業(yè)務都需要足夠深才能發(fā)揮價值、也有對應的公司在深耕，這或許是 OpenAI 要面臨的挑戰(zhàn)。

盡管 o3 模型讓外界看到了 OpenAI 驚人的技術實力，但關于推理的 Scaling Law 能達到怎樣的智能上限、以及 GPT-5 的難產(chǎn)問題，依然讓外界對這家公司的技術發(fā)展充滿疑慮。這次發(fā)布會上，OpenAI 將關注點轉而放在產(chǎn)品形態(tài)、合作生態(tài)和落地建設上，也未嘗不是一種思路。這兩者的結合，可能決定了行業(yè)接下來的走向。

關注多享有數(shù)，持續(xù)為您分享行業(yè)熱點要聞！

四川多享信息技術有限公司是一家專注于數(shù)字化服務、系統(tǒng)開發(fā)、新媒體營銷、農(nóng)村電商的專業(yè)互聯(lián)網(wǎng)公司，公司位于成都高新區(qū)天府二街，成立16年，擁有豐富開發(fā)經(jīng)驗，至今已助力5000+中小企業(yè)實現(xiàn)數(shù)字化轉型升級。

研發(fā)了B2C商城系統(tǒng)、私域運營系統(tǒng)、分銷商城系統(tǒng)、S2B2b2C供應鏈商城系統(tǒng)、小程序商城系統(tǒng)等，支持中臺云倉、供應商、自營商城、直播、短視頻、分銷、零售商管理、運營商管理、營銷工具、數(shù)據(jù)分析、會員儲值、積分商城等功能，幫助企業(yè)實現(xiàn)數(shù)字化轉型，助力降本增效，獲取更多收益！

天天影视网色香欲综合网_大桥久未无码吹潮在线观看_日韩欧美一区二区三区免费看_中文人妻无码一区二区三区

01 o3 的智能深度已經(jīng)夠了，但能否稱之為 AGI 要看智能廣度

02 模型只是發(fā)動機，關鍵是幫助開發(fā)者用起來

03 Sora 的視頻生成低于預期，但產(chǎn)品開放會提升其物理模擬能力

04 內(nèi)加功能、外接生態(tài)，ChatGPT 能變成 Super App 嗎？

電話咨詢

友情鏈接

天天影视网色香欲综合网_大桥久未无码吹潮在线观看_日韩欧美一区二区三区免费看_中文人妻无码一区二区三区

01 o3 的智能深度已經(jīng)夠了，但能否稱之為 AGI 要看智能廣度

02 模型只是發(fā)動機，關鍵是幫助開發(fā)者用起來

03 Sora 的視頻生成低于預期，但產(chǎn)品開放會提升其物理模擬能力

04 內(nèi)加功能、外接生態(tài)，ChatGPT 能變成 Super App 嗎？

電話咨詢

友情鏈接

01 o3 的智能深度已經(jīng)夠了，但能否稱之為 AGI 要看智能廣度

02 模型只是發(fā)動機，關鍵是幫助開發(fā)者用起來

03 Sora 的視頻生成低于預期，但產(chǎn)品開放會提升其物理模擬能力

04 內(nèi)加功能、外接生態(tài)，ChatGPT 能變成 Super App 嗎？