Quel est le principe technique du capteur de vision 3D ? Cette technologie ne nécessite-t-elle pas un grand modèle pour la formation ? Si la formation de grands modèles n’est pas nécessaire, comment pouvons-nous garantir que les robots équipés des capteurs de vision 3D de l’entreprise peuvent reconnaître tous les objets ou personnes ?

0
Obi Zhongguang-UW : Bonjour ! Il existe de nombreux principes de technologie de détection de vision 3D, tels que la lumière structurée, la vision stéréo binoculaire, ToF, etc. Parmi eux, la vision stéréo binoculaire est plus proche de la vision binoculaire humaine. Orbbec dispose d'une gamme complète de technologies de perception visuelle 3D, comprenant six axes technologiques de perception visuelle 3D courants : lumière structurée, iToF, binoculaire, dToF, Lidar et mesure tridimensionnelle industrielle. La technologie actuelle de perception visuelle 3D est principalement utilisée pour obtenir des flux vidéo RVB, IR, de profondeur et autres. La reconnaissance est effectuée sur la base de ces flux vidéo. Il n'y a pas de formation de modèle à grande échelle dans le processus d'acquisition de flux vidéo multimodal (vision 3D). La technologie de perception elle-même ne nécessite pas nécessairement un grand modèle pour la formation, mais nécessite de combiner les données tridimensionnelles obtenues par le capteur avec des algorithmes de comparaison pertinents pour parvenir à la reconnaissance des visages, des corps ou des objets). Au lieu de cela, c'est par l'intermédiaire d'experts en détection visuelle 3D Le résultat d'une expérimentation continue avec l'expérience et des micro-innovations d'ingénierie. Actuellement, nous essayons également d'utiliser des modèles pour l'estimation de la profondeur en vision stéréo binoculaire. À l'avenir, il sera possible d'utiliser des modèles pour s'adapter à des environnements plus complexes et obtenir des données RGB-D plus complètes. Merci pour votre attention et votre soutien envers notre entreprise !