現在很多人都在用 bing、Midjourney 這類的 AI 工具創作圖像,而 Apple 也被認為在今年會推出更針對 AI 相關的功能。在上週就有外媒報導,蘋果發布了一項名為「MGIE」的開源 AI 模型,甚至透過 AI 讓文字轉變成動畫。
Apple 研究員發表 AI 開源模型
蘋果的研究人員上週釋出了一個新的開源 AI 智慧模型,能夠根據使用者的自然語言指令(透過VentureBeat)來處理影像工作。
可以做的內容包含了影像的顏色調整、對比度調整、更改照片風格….等,甚至是要去被、要做大小的裁切,透過 Apple 的 MGIE 模型都能夠處理。
例如給它一張披薩的照片,然後跟它說要讓披薩看起來健康一點,他就會在披薩上加上一些綠色蔬菜,畢竟有菜就是被認為是比較健康的感覺。
或是社要把天空從白雲換成閃電、要移除背景的雜物、要調整亮度或是在一份甜甜圈上加莓果醬,Apple 的 MGIE 模型都可以做到。
利用文字生成動態影像
與此同時,蘋果也推出了一種名為「Keyframer」的新工具,只要輸入自然語言(就是我們一般說話的方式)就可以生成動態的影像。
在蘋果這份報告中展示了兩個範例,其中一個是讓太空中的星星閃爍,星球周圍的光暈也要有所變化;另一個則是太空火箭要不斷的上升,所以背景的月亮和雲會往下降。
雖然這些圖片都可以在現有的 AI 工具上一張一張生成,但是因為每次生成的結果可能都會不同,接在一起可能很不順暢,但是 Apple 的開發人員是透過他們開發的工具搭配 AI 語言模型,讓這些圖片可以在一個指令下就生成。
另外,這次發表的內容是蘋果的開發人員與加州大學研究人員合作完成,並在國際學術會議上發表的相關成果。
而且上面的功能未必會直接在 Apple 產品中讓大家使用,我覺得比較蘋果的做法應該是把這個功能與技術融合在其他的應用中。
分析師預估蘋果 2024 年將會有比較大的 AI 進展
雖然蘋果過去都強調他們一直有在使用 AI,並且已經落實在 iPhone 的各項功能中,包含照片的處理、根據對應時間與情況顯示不同的 Widget 小工具、Homekit 相關應用….等,但是這些都是比較隱性的,相較於 ChatGPT、Bing 以及 Google Gemini(之前的 Bard)來說,使用者比較不會有「真的在使用 AI 工具」的感覺。
而預計在 iOS 18 和 iPadOS 18 推出後,蘋果也會推出類似 ChatGPT 的生成式 AI 功能,並且加入到 Siri 中,讓 Siri 進化成 Siri 2.0,這個最快應該可以在今年 6 月的 WWDC 上看到,大家就期待看看吧。