Lass Uns Reden
Beginnen Sie die Konversation mit unseren Analysten und Entwicklern. Zusammen erheben wir die Bedürfnisse und skizzieren die neue Lösung
Künstliche Intelligenz hat in letzter Zeit einen guten Ruf erlangt. Ein Hauptbestandteil der Künstlichen Intelligenz ist der Bereich Computer Vision, der es Computern und Systemen ermöglicht, die aussagekräftigen Informationen aus digitalen Bildern, Videos und anderen visuellen Eingaben zu verstehen. Und dann könnte unser System basierend auf diesen Informationen automatisch Aktionen ausführen oder Aufgaben erledigen.
Wir zeigen Ihnen einige interessante Anwendungen im Bereich Computer Vision wie Objekterkennung, Objekterkennung, Objektschätzung, Objekterzeugung usw.
Für unseren Anwendungsbereich benötigen wir eine Lösung zur Echtzeit-Gesichtserkennung im WebRTC-Stream. Einige moderne Gesichtserkennungsmodelle zeigen zwar in letzter Zeit sehr gute Leistungen, aber auch die Inferenzgeschwindigkeit spielt eine Rolle für die Echtzeitfähigkeit. Daher haben wir nach einer alternativen Lösung gesucht und eine sehr gute Modellarchitektur aus diesem Artikel gefunden: BlazeFace: Sub-Millisekunden-Gesichtserkennung auf mobilen GPUs (https://arxiv.org/pdf/1907.05047.pdf). Wir haben dieses vortrainierte Modell in unser System integriert und festgestellt, dass es die Echtzeit-Gesichtserkennung im Kamera-Stream mit hoher Leistung und schneller Inferenzgeschwindigkeit bewältigen kann.
Ähnlich wie bei der Gesichtserkennungsaufgabe müssen wir auch bei der Verarbeitung des Echtzeit-Kamera-Streams die Leistung und die Inferenzgeschwindigkeit im Auge behalten. Deshalb haben wir die gleiche Idee wie bei der Gesichtserkennungsaufgabe angewendet, jedoch mit BlazeFace für Hand-Datasets. Nachdem wir die Handposition auf dem Bild erhalten haben, verwenden wir ein Modell aus diesem Artikel: Attention Mesh: High-Fidelity Face Mesh Prediction in Real-time (https://arxiv.org/pdf/2006.10962.pdf), um die 3D-Schlüsselpunkte der Hand zu schätzen.
Greifen Sie auf die Website zum Analysieren von Objekten in Bildern zu: https://experiment.saigontechnology.vn/computer-vision/ . Alternativ können Sie die Hauptseite des Saigon Technology AI Research Lab hier aufrufen: https://experiment.saigontechnology.vn/, den Bereich [CV]: Analyzing Object behavior on Image auswählen und auf die Schaltfläche „Try our demo“ klicken.
Klicken Sie auf der Seite „Analyzing Object behavior on Image“ auf die Schaltfläche „Start“, um die Anwendung zu verwenden. Sie können auch die Schaltflächen links verwenden, um die Gesichts- und Handmodelle ein- oder auszuschalten.
Gesichtserkennungsmodell und Gesichts-Keypoint-Schätzungsmodell
Ergebnisse der Hand-Keypoint-Schätzungsmodelle
Beginnen Sie die Konversation mit unseren Analysten und Entwicklern. Zusammen erheben wir die Bedürfnisse und skizzieren die neue Lösung
Gemeinsam mit unseren Entwicklern und Analytikern beginnen wir mit der Diskussion und Analyse der Kundenbedürfnisse und skizzieren die Grundzüge.
© 2022 STS Software GmbH. All rights reserved.
Gemeinsam mit unseren Entwicklern und Analytikern beginnen wir mit der Diskussion und Analyse der Kundenbedürfnisse und skizzieren die Grundzüge.
Melden Sie sich an, um die neuesten Informationen und tolle Angebote direkt in Ihren Posteingang zu erhalten.
© 2022 STS Software GmbH. All rights reserved.