„Willow Voice“: KI-gestützte Sprachdiktate

Willow Voice transkribiert Sprache-zu-Text und räumt mit KI vor der finalen Niederschrift auf – ähnlich wie das bereits besprochene Wispr Flow.

Ein iPhone-förmiges Mockup, das eine Text-to-Speech-App auf seinem Bildschirm zeigt, vor einem dunkelblauen Farbverlauf. Ein Mann mit Brille, Baseballkappe und Mikrofon befindet sich in der unteren linken Ecke in einem kreisförmigen Ausschnitt. Der iPhone-Bildschirm zeigt deutschen Text.

Vimeo / YouTube

Für mich definieren diese KI-Sprachdiktatanwendungen das Zusammenspiel zwischen Mensch und Maschine neu. Meine Finger greifen am Mac viele Male pro Tag zum Hotkey; am iPhone wechsle ich ständig zur jeweiligen Tastatur – für eine kurze iMessage oder einen flüchtigen Gedanken in Tot.

Regelmäßig benutze ich das Wort „actually“ und korrigiere mich mitten im Satz. In der Ära moderner Transformer-Modelle bügelt KI aber nicht nur die Unterschiede zwischen Sprech- und Schreibgewohnheiten aus, sondern lässt mich fließend Sprachen wechseln – je nach Adressat oder Kontext.

Auf iPhones sind Kontextkenntnisse hoffentlich ein nächster großer Schritt. Ich sollte meinem Telefon nicht sagen müssen, in welcher Anwendung ich mich befinde und welche Informationen ich dort als bekannt voraussetze.

#488 – DEVONthink To Go 4

DEVONthink muss nicht gleich eine tiefgreifend integrierte und langfristig angelegte Wissensdatenbank sein; eine mächtigere Dokumentenverwaltung ist speziell auf iPhone und iPad bereits ein großer Gewinn. Die neue „To Go“-Version ist funktionsreich und überraschend autark.

Hier das Intro zur Episode:

iPhoneBlog #one kann man abonnieren. Alle Abonnent:innen bekommen jede Woche ein neues „Gewusst-wie”-Video, den Zugriff auf alle schon veröffentlichten Episoden und die Einladung zu einer ganz besonderen Community in einem privaten Slack-Kanal.

iPhoneBlog #one ist ausschließlich von Lesern und Leserinnen finanziert und unterstützt direkt das iPhoneBlog.

„3x more scratch-resistant“

@AppleCanada

„3x more scratch-resistant compared to iPhone 16“ – und ich fand die erste Version von Ceramic Shield im Vorgängermodell bereits äußerst beeindruckend.

Apple wählt Gemini als sein Herzblatt

„So, … nun musst du dich entscheiden.“

Ein Tweet von News from Google, der eine gemeinsame Erklärung mit Apple ankündigt, in der eine mehrjährige Zusammenarbeit skizziert wird, bei der die nächste Generation der Apple Foundation Models auf Googles Gemini-Modellen und Cloud-Technologie basieren wird, um zukünftige Apple Intelligence-Funktionen, einschließlich einer stärker personalisierten Siri, zu unterstützen, wobei Apple seine Datenschutzstandards beibehält.

Google liefert künftig die KI-Basis für alle Foundation-Modelle von Apple – Siri inbegriffen. Die Ankündigung ging an CNBC und ins Google CompanyBlog. Die mehrjährige Zusammenarbeit wird nicht komplett verschwiegen, so wie Gurman im November spekulierte, richtet sich aber eher an die finanzorientierte Zielgruppe.

While the partnership is substantial, it’s unlikely to be promoted publicly. Apple will treat Google as a behind-the-scenes technology supplier instead. That would make the pact different than the companies’ Safari browser deal, which made Google the default search engine.

Mark Gurman

Die Partnerschaft ist im Moment ein taktischer Gewinn für beide Firmen: Apple stärkt seine Produkte; Google erzielt die Oberhand im Armdrücken gegen OpenAI und sichert seine Web-Dominanz.

ChatGPT geht als größter Verlierer hervor. Entweder konnte/wollte es kein angepasstes (mobiles) Modell für Private Cloud Compute entwickeln, oder Apple schloss sie aufgrund der eigenen Hardware-Ambitionen aus („after careful evaluation“). weiterlesen

Von Xbox bis Nvidia: „CloudGear“ verbessert Game-Streaming auf iOS

Wer sich Spiele aus dem Katalog von Xbox Cloud Gaming oder GeForce Now aufs iPhone oder iPad streamt, ist verpflichtet, einmal CloudGear auszuprobieren – einen speziell fürs Game-Streaming optimierten iOS-Browser.

A purple GameCube controller is positioned in front of a monitor displaying a fantasy game scene. The scene includes characters in a medieval setting, beneath a starry sky with decorative pennants. A laptop screen is to the right with video displayed on an external monitor and a backlit keyboard is below the monitor.

For too long, cloud gaming on iOS has been held back by the limitations of standard web browsers. Missing features like controller rumble, mouse pointer lock, and proper HDR support meant that iPhone and iPad gamers were getting a second-class experience compared to desktop users.

CloudGear changes that today.

CloudGear.app | via Brendon Bigley

„Microsoft beeindruckt; für Apple bleibt es eine verpasste Chance“ resümierte ich vor viereinhalb Jahren. Daran hat sich gleichzeitig nichts und alles geändert: Spiele-Streaming ist heute sehr viel eindrucksvoller, doch Apple trampelt immer noch beleidigt auf der Stelle.

Der iPhone-Hersteller untersagt den Streamingdiensten nicht nur native Apps im Store, sondern hält zusätzlich die Safari-Handbremse angezogen. Es gibt faktisch keinen Grund, warum CloudGear mit der gleichen Basistechnologie und einigen direkt integrierten Open-Source-Anstrengungen ein so viel besseres – wenn auch nicht perfektes – Ergebnis liefert.

Ganz ernsthaft: Wenn ihr ohnehin fürs „Spielen aus der Cloud“ bezahlt, schaut auf die Feature-Liste und probiert den Browser mit einem Controller eurer Wahl unbedingt aus.

Über Pinchflat zu PushPod: Ein eigener Podcast-Feed für YouTube-Shows

Für Shows auf YouTube, die auch ohne Videobild funktionieren, aber keinen separaten Audio-Download anbieten, erstelle ich einen eigenen Feed.

Smartphone-Bildschirm, der eine Medienverwaltungsanwendung anzeigt und eine dunkle Oberfläche mit verschiedenen Datenpunkten für heruntergeladene Medien, einschließlich Medienprofile, Quellen, Downloads und Bibliotheksgröße, zeigt. Die Anwendung zeigt unter "Media History" eine Registerkarte "Heruntergeladen" an, die Optionen zum Verwalten und Durchsuchen heruntergeladener Inhalte vorschlägt.

Pinchflat läuft dafür in einem Docker-Container auf dem NAS und schaut nach neuen Clips, die ich auf YouTube in eine „Unlisted-Playliste“ stecke – sehr bequem, ohne am Mac zu sitzen.

Pinchflat lädt über ein „Media Profile“ lediglich die Audiospur dieser Clips, behält die Downloads lokal für zwei Wochen und räumt dann hinter sich auf („Retention Period“). Über die „Cloud Drives“-App synchronisieren sich neue Dateien auf Dropbox. Dort registriert PushPod die neuen Einträge und schreibt sie in einen RSS-Feed für meine Podcast-App.

Die Dateien in Dropbox lösche ich, wenn ich einmal daran denke – meistens über den Zugriff via Transmit oder Forklift. So erspare ich mir die Installation des Dropbox-Clients auf dem Mac.

Nicht mehr nur für Plex: Prologue spielt Audiobookshelf-Hörbücher

Ein Smartphone, das eine Benutzeroberfläche einer Dark-Theme-Hörbuch-App anzeigt und Buchcover mit Titeln wie "Things Become Other Things", "Apple in China" und "Playworld" auflistet.

Prologue 4.0 is here, rebuilt from the ground up with Audiobookshelf support and a fresh new look.

prologue.audio

„That’s it. That’s the feature.“ Aber was für eine coole Neuerung und weitere Alternative das ist!

„RAW Cam“ filmt in Profi-Qualität auch mit älteren iPhones

Für ’nen Zehner kitzelt ihr aus RAW Cam auch auf älteren (Nicht-Pro-)iPhones hochauflösendes Video. Die dort erzeugten MCRAW-Dateien sind MotionCam-Container – eine Sequenz aus DNG-Einzelbildern, die ihr zuerst über MotionCam Tools extrahiert und dann in DaVinci auf dem Mac weiterverarbeitet.

In voller (Open-Gate-)Auflösung können bis zu 12 GB pro Minute anfallen. Die notwendigen Arbeitsschritte für die großen Dateien besetzen eine interessante Nische – insbesondere wenn iPhones nicht in ProRes mit LOG-Codierung aufnehmen können.

Die beeindruckenden Ergebnisse können dann so oder so aussehen, besitzen aber Einschränkungen, die @EpicTutorials beschreibt. Das größte Hindernis bleibt jedoch der holprige Workflow, den ich selbst einmal nachvollzogen habe.

Mit Frost bedeckte Baumrinde im Vordergrund einer Winterlandschaft, durch ein QuickTime Player-Fenster auf einem Mac-Desktop betrachtet, mit einem Mann in der Ecke.

Vimeo / YouTube