„Apple’s Next Big Thing Is a Push Into Visual Artificial Intelligence“
Tim Cook, in der modernen Version von „I think the wrist is interesting“.
In a recent all-hands meeting with employees, Cook said that Apple “unquestionably” has a “huge advantage” in the AI space, touting the company’s installed base of 2.5 billion. He mentioned Apple Intelligence again and gave a shoutout to one specific feature. You guessed it: Visual Intelligence.
This was no accident. To date, Apple has done little in visual AI other than create a wrapper for OpenAI and Google technologies. Yet Cook is touting this capability as central to Apple’s AI strategy. He wouldn’t be putting it at the forefront of his remarks if things weren’t going to accelerate in that area soon.
Mark Gurman | Bloomberg

Unser Auto benötigte gestern Öl: „Oil pressure is low. Turn off vehicle immediately.“ Das war als Dashboard-Hinweis in neonroter Warnfarbe nicht schwierig zu verstehen. Ich habe ein Foto davon trotzdem durch Gemini gejagt, weil mir alles an diesem Thema fremd ist.
Von der Identifizierung des Öleinfüllstutzens im Motorblock bis zu einem Bild des Verkaufsregals der vielen unterschiedlichen Ölkanister wurde mehrmals visuell kommuniziert. Über Bilder habe ich mir außerdem die diversen Label und Unterschiede zwischen voll- und teilsynthetischen Ölen erklären lassen.
Der fortlaufende Thread verlief jedoch nicht einseitig visuell, sondern multimedial: von Texthinweisen in Form von Schritt-für-Schritt-Erklärungen bis zu Instruktionen, die ich mir auf der Rückfahrt vom Geschäft vorlesen ließ.
Natürlich wusste Gemini um meine Örtlichkeit und dass ich bei winterlichen -20 Grad Außentemperatur unter der Motorhaube hänge. Seine Empfehlung: Öl nicht in einem Schwung reinkippen, sondern absinken lassen …
… worauf ich hinaus will: Wette nicht gegen die Multifunktionalität des Smartphones – mit allen seinen Sensoren, der technologischen Konvergenz sowie Konnektivität.
Meine Unwissenheit wurde gestern jedoch nur deshalb überwunden, weil der Zusammenhang fortlaufend erhalten blieb. Einzelne Fragen zu einzelnen Aktionen, so wie Apples Visual Intelligence sie im Moment anbietet, sind nicht annähernd mit der Zusammenführung von (bereits erfragten) Daten und Informationen in einem großen Kontextfenster zu vergleichen.