P

PotatoEcho

你只用了 Gemini 5% 的能力?這影片揭露了 Google AI 的真正野心!

原视频:📺 YouTube发布日期:2026-05-21科技趨勢

📋 Brief

這支影片深度訪談了 Google Gemini 負責人 Josh Woodward,他揭示了 Gemini 如何從一個聊天機器人,蛻變成能為你全天候工作的「智能代理人」。影片強調了 Google 如何將 AI 整合進日常工具,將我們的角色從「執行者」轉變為「指揮者」,大大提升生活與工作效率。


⏱️ 內容分段導航

時間段 內容摘要
00:00 - 00:35 Gemini Spark 登場,預示 AI 代理人時代來臨,釋放你的時間。
00:35 - 01:46 Google AI 的重大轉變:邁向代理人時代,並展示語音功能的快速進化。
01:46 - 03:04 令人驚嘆的語音與多檔案整合能力,兩週內從概念變現實。
03:04 - 04:50 Gemini 的核心優勢:深度整合、平行處理能力及豐富的生成式媒體工具。
04:50 - 06:53 AI 如何解決數位雜務、釋放個人時間,並成為生活與工作的助手。
06:53 - 09:38 AI 驅動的語音優先互動,以及知識工作者從「做」到「導」的角色轉變。
09:38 - 11:53 「人人都是經理」的未來工作模式,以及從 SEO 到 AEO 的品牌新挑戰。
11:53 - 15:37 Google 在 AI 競爭中脫穎而出,透過個人化與實用小功能贏得人心。

📖 詳細內容

01|AI 代理人時代:解放你的時間

核心觀點: Google 推出 Gemini Spark,標誌著一個全新「代理人」時代的開始。這款 AI 工具能夠在後台 24/7 為用戶工作,深度整合於 Google 的各項服務,例如 Gmail、Google 文件、試算表、簡報和日曆,目標是幫助我們擺脫日常瑣事,將時間花在真正想做的事情上,像是陪伴家人或發展興趣。

重要原話:

"If you're a Gmail user, use Google Docs, Sheets, Slides, Calendar, all that stuff just works. Helping us free up time in our calendar so we can do things we want to do either together with our family, hobbies, and whatnot."

(如果你是 Gmail 用戶,使用 Google 文件、試算表、簡報、日曆等,所有這些工具都能順暢運作。它幫助我們釋放日曆上的時間,讓我們可以將時間用於想做的事情,無論是與家人共度時光、培養興趣,還是其他。)

個人感受: 聽到 Gemini Spark 能自動化處理日常瑣事,我立刻想到那些總是拖延的「數位雜務」。如果 AI 真的能幫我把這些事情搞定,那感覺就像多了一雙手,甚至多了一個大腦,能把精力放到更有趣、更有價值的地方。

延伸思考: 這種代理人模式不只是提升效率,它其實在重塑我們對「工作」和「時間」的理解。當機器接手例行公事,我們作為人類將被迫思考,我們獨特的價值到底在哪裡。

可參考的行動: 在 Gemini Spark 正式推出後,試著列出你最討厭的五件「數位雜務」(例如:整理收據、回覆制式電郵),看看 AI 能否幫你解決其中至少一件。


02|Google I/O 重大發佈:邁向代理人與全能模型

核心觀點: 此次 Google I/O 對 Josh Woodward 來說,是近 20 年來最具影響力的一次。原因有二:一是 Google 正全面轉向「代理人時代」,讓 AI 不僅是工具,更是執行者;二是 Gemini Omni 模型的出現,它能處理各種輸入並產生多樣輸出,結合了科學研究上的突破,預示著更強大的 AI 能力。

重要原話:

"I think this is a big one for a couple of reasons. One, it's the first time we're really starting to shift more into this agentic era. And I think that'll be a big shift for a lot of our products. ... this Gemini Omni model is another one. It's a very big shift in how we start to think about any kind of input in and the output that comes out of it."

(我認為這次發佈意義重大有幾個原因。首先,這是我們第一次真正開始轉向這個代理人時代。我認為這將是我們許多產品的巨大轉變。... Gemini Omni 模型是另一個關鍵。它徹底改變了我們對任何輸入和其產出的思考方式。)

個人感受: 我很喜歡他把這形容為「代理人時代」,聽起來不只是升級現有功能,而是改變了遊戲規則。特別是 Omni 模型,讓我想像到 AI 不再是單一技能,而是十八般武藝樣樣精通。

延伸思考: 當 AI 不只處理文字,還能理解圖像、聲音甚至生成複雜媒體內容時,我們與數位世界的互動方式將發生根本性的變化,甚至挑戰現有的內容創作模式。

可參考的行動: 關注 Google AI 部落格,了解更多關於 Gemini Omni 模型的技術細節,思考它可能對你的行業產生什麼影響。


03|語音互動的驚人進化:從兩週到實際應用

核心觀點: 影片中展示的語音功能令人印象深刻:用戶透過語音指令,AI 不僅能轉錄內容,還能主動連結 Google Drive、Gmail 等工具,整合相關資訊,並產生格式精美的電郵,甚至包含表格。這項僅用兩週時間開發的功能,凸顯了 AI 快速迭代與整合多源資訊的能力。

重要原話:

"When you were demoing this voice feature, like you're talking to your computer, but instead of just transcribing, it actually went to your Google Drive, went to your Gmail, Yeah. found all the necessary information, pulled it together, and created this beautiful email with like a table inside of it and the rest of it. I like this is nice. This is the next step of voice."

(當你演示這個語音功能時,就像你在跟電腦說話,但它不只是轉錄,它實際上會去你的 Google Drive、Gmail,找到所有必要的資訊,將它們匯集起來,然後創建一封精美的電郵,裡面甚至有表格。我很喜歡這個,這是語音功能的下一步。)

個人感受: 我簡直不敢相信這個複雜的功能只用了兩個週末就搞定。這讓我覺得,現在 AI 的發展速度真的很快,很多我們覺得未來才會實現的事情,可能下一秒就變成現實。

延伸思考: 這種語音結合多應用程式的智能互動,會極大降低技術門檻,讓不熟悉複雜介面的人也能有效利用電腦,可能會催生出全新的「無介面」應用模式。

可參考的行動: 密切留意 Gemini Spark 中語音功能的推出,嘗試對它說出一個複雜的請求,例如「幫我總結最近三個月關於某專案的電郵並生成報告草稿」。


04|為何選擇 Gemini:深度整合與多媒體生成力

核心觀點: Josh 強調 Gemini 的三大核心優勢。首先是與 Google 生態系統的深度整合,無需連接器,就能無縫使用 Gmail、Docs、Sheets、Calendar 等。其次是利用 Google Cloud 的虛擬機器,實現數百個任務的平行處理,極大提升效率。最後,Gemini 擁有獨特的生成式媒體套件(如 Nana Banana 創作圖像、Omni 製作影片、Lyric 創作歌曲),提供其他平台無法比擬的多元創作能力。

重要原話:

"First, it is deeply integrated in the Google environment and ecosystem. ... Second thing, we actually have virtual machines that we can spin up in the background on Google Cloud. So, I think where all this is going is you won't just have one or two tasks. You may have hundreds of tasks. And you can imagine we can do that in parallel. ... The third I would say is we're really trying to push the limits on the types of things that Spark's going to be able to create for you. So, what I showed on stage was a Google Doc or a Google Slide Deck for our neighborhood block party. But, imagine this has got Nana Banana. It can make images. It's got Omni. It can make videos. It's got Lyric. It can make songs."

(首先,它深度整合在 Google 環境和生態系統中。... 第二點,我們實際上擁有可以在 Google Cloud 後台啟動的虛擬機器。所以我認為這一切的走向是,你將不會只有一兩個任務。你可能有數百個任務。而且你可以想像我們可以平行處理這些任務。... 第三點我想說的是,我們真的在努力突破 Spark 能夠為你創建的內容類型限制。所以,我在舞台上展示的是一個用於我們社區街區派對的 Google 文件或 Google 簡報。但想像一下,它有 Nana Banana 可以製作圖像,有 Omni 可以製作影片,有 Lyric 可以製作歌曲。)

個人感受: 說到深度整合,我懂那種感覺!在不同工具之間切換、匯出匯入資料真的很煩。如果 Gemini 能像大管家一樣把我的 Google 數位資產都串起來,那真的會省下很多麻煩。而且能生成這麼多不同類型的內容,聽起來就是創作者的夢想。

延伸思考: 這種多模態生成能力不僅僅是創作內容,它可能改變我們思考「點子」到「產品」的過程,讓原型製作和概念驗證變得異常快速和多元。

可參考的行動: 如果你已經是 Google Workspace 用戶,開始思考哪些日常工作流程可以透過 Gemini 的深度整合來簡化,例如自動生成會議摘要或活動邀請。


05|AI 如何成為你的生活與工作幫手

核心觀點: Gemini 的實用性超越了工作。Josh 舉例說明,它能幫助像媽媽一樣的用戶處理「數位雜務」,例如提醒孩子歸還圖書館的書。它還能優化個人時間管理,如協助找出並取消不必要的會議,釋放日曆空檔。此外,它能根據用戶興趣,提供個人化的資訊匯報,例如以死忠球迷的語氣匯報 NBA 賽事新聞。

重要原話:

"It is so good at any kind of just A lot of people that we've been doing user research are like, I have all these digital chores I have to go do. So, it might be like helping you remember things that you might have forgot. ... Anything around like, "Help me not forget something." Yeah. "Help me free up time. Help me follow an interest I'm really passionate about." It's excellent in all that stuff."

(它非常擅長處理各種事情。許多我們做用戶研究的人都說:「我有很多數位雜務需要去處理。」所以它可能會幫助你記住你可能忘記的事情。... 任何關於「幫助我不要忘記事情」、「幫助我騰出時間」、「幫助我追蹤我真正熱愛的興趣」方面,它都非常出色。)

個人感受: 「數位雜務」這個詞說到我心坎裡了,光是想到每個月要處理的瑣事就頭疼。如果 AI 真的能幫我記住那些小而重要的截止日期,或是建議我砍掉哪些沒必要的會議,我會覺得自己瞬間輕鬆很多。

延伸思考: 這種個人化、主動式的 AI 協助,最終目標是減少我們在「維持生活運轉」上的心力消耗,將更多精神和情感投入到更有意義的互動和創造中。

可參考的行動: 在 Gemini 推出後,嘗試向它提問:「我這個禮拜應該取消哪兩個會議?」,或者「幫我整理我關注的三個運動隊伍的最新賽況,用狂熱粉絲的語氣。」


06|語音優先的未來與知識工作者的角色轉變

核心觀點: Josh 認為,語音正逐漸成為 AI 互動的主導方式,因為它更自然、更快速,且 AI 模型能自動清理口語表達的雜亂資訊、呼叫工具、生成內容。這種轉變不僅限於軟體工程師,更重要的是解放了知識工作者。NotebookLM 是一個很好的例子,它讓用戶能輕鬆匯集資料,並透過簡單指令生成播客、簡報、心智圖等,將知識工作者的角色從「執行者」轉變為「指揮者」,專注於成果而非過程。

重要原話:

"There are certain countries now where it's tipped, and voice has become just a dominant way ... It's natural, right? It's natural. It's faster. It's also Now, we're at a point where you can kind of ramble, and the model can clean it up for you. ... I think for knowledge workers it's very exciting, but also it's it is a different shift because you're almost going to a point where you're orchestrating much more about the outcome of the deliverable you want instead of the how to get there in some cases."

(現在有些國家已經出現轉變,語音已成為主導的溝通方式... 很自然,對吧?很自然,也更快。而且現在我們已經到了可以隨意說話,模型能為你清理內容的程度。... 我認為對知識工作者來說這非常令人興奮,但這也是一個不同的轉變,因為你幾乎要達到一個點,你可以更多地協調你想要的成果,而不是某些情況下如何實現它。)

個人感受: 我自己就常常對著電腦說話,感覺語音真的是最直觀的輸入方式。如果 AI 能理解我隨意的指令,並幫我整理好,那感覺就像有個隨身助理。而從「執行者」到「指揮者」的轉變,聽起來就讓我更期待把更多時間用來思考策略和創意了。

延伸思考: 這種語音優先和「指揮者」模式,將對教育和培訓產生巨大影響。未來的學習可能更側重於提問、批判性思考和結果導向,而非機械式的知識記憶和操作。

可參考的行動: 嘗試用語音指令來安排你的日常行程,看看 AI 能否比你手動輸入更快速、準確地理解你的需求並執行。


07|人人都是經理:AI 時代的品牌新戰略

核心觀點: 隨著 AI 代理人的普及,每個人都將扮演「經理」的角色,指揮 AI 代理人執行任務。這意味著企業需要為所有員工提供「經理培訓」,以適應這種新的工作模式。此外,過去企業優化 Google 搜尋引擎(SEO)的策略也需要轉變,因為現在用戶更多地透過 AI 助手(如 Gemini、ChatGPT、Perplexity)獲取資訊和決策。品牌需要從 SEO 轉向 AEO(AI Engine Optimization),確保其內容能在 AI 回答中被呈現。

重要原話:

"We on the team talk about it as you're moving from doing to directing. Exactly. Everybody becomes a manager. That's right. ... No. That we're imagining we may need that for everybody because you may be managing these different sort of like agents and others. ... The problem is most founders have no idea how to make their brand show up in those answers, and we noticed that, too."

(我們團隊討論這件事時,會說你正從「執行」轉向「指揮」。沒錯,每個人都變成經理了。... 我們想像這可能需要為每個人提供培訓,因為你可能會管理這些不同類型的代理人等等。... 問題是大多數創始人不知道如何讓他們的品牌出現在這些 AI 回答中,我們也注意到了這一點。)

個人感受: 「人人都是經理」這個說法,起初讓我有點緊張,但細想後覺得挺有道理。未來如果不能有效指揮 AI,就像過去不會用電腦一樣,會失去競爭力。品牌從 SEO 轉向 AEO,這點讓我為我的內容創作捏把冷汗,得趕快研究新的優化方法了。

延伸思考: 「指揮」能力的普及,將考驗個人的清晰表達、問題拆解和協作能力。同時,品牌如何在 AI 回答中獲得「推薦」,將成為新的市場戰場,可能導致新的數據倫理和透明度問題。

可參考的行動: 如果你是內容創作者或品牌經營者,開始研究 AI 搜尋優化(AEO)的初步概念,例如在內容描述中加入更精準的問題和答案,或利用工具分析品牌在 AI 回答中的表現。


08|Google AI 競爭策略:整合、個人化與信任

核心觀點: Josh 承認 AI 領域競爭激烈,但他認為這能激發 Google 團隊更努力。他指出 Google 的獨特優勢在於擁有多年累積的技術和龐大的生態系統。透過「個人智慧」專案,他們讓用戶選擇性地將個人資料(Gmail、Drive 等)連接到 AI,實現深度個人化服務,且無需連接器。Google 的策略是透過提供一系列小型、實用且可分享的功能,解決用戶日常煩惱,讓用戶感受到「Gemini 能為你做什麼」,而非空泛的「AI」。最終目標是建立一個值得信賴、有幫助的 Gemini 個性。

重要原話:

"I think competition, a lot of us on the team we like that because you get this it sharpens you. ... there's a lot of things Google has, and in some cases has had for years. And what's fun for someone like me who's been around here a while is is like how do you kind of put these together in new and interesting ways? ... it's not about look what AI can do for you, it's about for your life, Yeah. your problems, your daily annoyances, the things that make you grumpy, how's it going to help?"

(我認為競爭對我們團隊很多人來說是好事,因為它能磨練你。... Google 有很多東西,有些甚至已經存在很多年了。對我這樣在公司待了一段時間的人來說,有趣的是如何將這些東西以新穎有趣的方式組合起來?... 這不是關於 AI 能為你做什麼,而是關於它能如何幫助你的生活、你的問題、你每天的煩惱、讓你心情不好的事情。)

個人感受: 我很欣賞他對競爭的看法,這確實能讓產品變得更好。Google 過去累積的數據和服務網路,確實是其他 AI 公司難以比擬的優勢。他提到「解決你的問題、你的日常煩惱」,這讓我感覺 AI 正在從技術高塔走下來,變得更貼近生活,這點很棒。

延伸思考: 在 AI 競爭白熱化的當下,用戶最終選擇的標準可能不再是模型跑分,而是誰能更無縫、更個人化地融入他們的日常工作流和生活,並建立起足夠的信任感。

可參考的行動: 在使用 Gemini 或其他 AI 工具時,刻意觀察它們如何處理你的「日常煩惱」或「數位雜務」,並比較不同工具在個人化整合與信任感建立上的差異。


💎 精華收穫

這支影片讓我看見,Google 的 AI 戰略不只是推出強大的模型,而是透過「智能代理人」與現有生態系統的深度整合,徹底改變我們與數位工具互動的方式。它承諾將我們從繁瑣的執行工作中解放出來,轉變為指揮者,讓 AI 成為真正的個人助手,替我們處理日常雜務、拓展興趣,並以更自然(例如語音)的方式理解我們的需求。這不只是一場技術競賽,更是一場關於如何重新定義人類時間與價值的未來之戰。


由 PotatoLearning Hub 自动生成

💬 讨论区