Décryptage des défis réels de la reconnaissance alimentaire par IA (1re partie)

Bento, assiettes composées, brochettes, fritures et sushis

Avec les progrès rapides de l’intelligence artificielle, de plus en more d’acteurs de la restauration intègrent la reconnaissance d’images dans leurs opérations. Assistance à la prise de commande, contrôle des plats avant service ou encore self-checkout : les usages se multiplient, avec un objectif commun — identifier les aliments plus vite et plus précisément.

Mais derrière cette apparente simplicité se cachent de vrais défis. Dans des environnements très courants — cantines, boutiques de bentos, restaurants japonais — des scènes banales pour un humain peuvent devenir de redoutables casse-têtes pour une machine.

Cet article présente quatre situations réelles rencontrées par Viscovery, spécialiste de la reconnaissance d’images, et montre comment ces obstacles ont été surmontés. Ces solutions fonctionnent aujourd’hui dans des restaurants d’entreprises, des cafétérias hospitalières ou encore chez Hi Noodle (groupe Haidilao à Singapour), contribuant à fluidifier les opérations et à renforcer l’efficacité globale.

Articles Connexes: Hi Noodle : l’IA au service du self-checkout

1. Bentos : quand chaque compartiment compte

Les boîtes à bento comportent souvent plusieurs cases contenant des mets différents : plat principal, légumes, œuf mariné, etc. Pour l’œil humain, l’identification semble évidente. Pour l’IA, c’est une autre histoire.

Avant de reconnaître les aliments, le système doit détecter correctement les compartiments. Or, si les ingrédients débordent ou si les sauces traversent les séparateurs, la tâche se complique.

Les modèles de Viscovery parviennent désormais à équilibrer localisation des cases et reconnaissance des mets, garantissant une performance stable malgré la diversité des boîtes et des présentations.

Articles Connexes: Comment l’IA transforme l’industrie du bento : une optimisation complète de la caisse à la qualité

Articles Connexes: Le marché taïwanais du bento en plein essor : comment l’IA aide les acteurs à se démarquer ?

2. Assiettes mélangées : distinguer chaque plat sans séparation visuelle

À l’inverse du bento, de nombreuses préparations sont servies sur une seule grande assiette, sans séparation : buffets, plats sur plaque chauffante, plateaux de cantine…

Ici, l’IA doit apprendre à segmenter visuellement chaque aliment.
Les difficultés apparaissent lorsque :

  • deux mets ont des couleurs proches,
  • les portions se touchent,
  • une partie est recouverte de sauce.

Des combinaisons courantes — nouilles sautées + chou braisé, curry + nuggets — peuvent aisément perturber un modèle.

Pour y faire face, Viscovery entraîne ses systèmes sur de vastes ensembles d’images annotées, améliorant la finesse de détection dans ces scènes visuellement complexes.

3. Brochettes et fritures : reconnaître… bâton par bâton

Passons aux stars des izakayas et marchés de nuit : brochettes et fritures.

As-tu déjà imaginé comment l’IA peut distinguer, sur une assiette contenant une dizaine de brochettes, chaque pièce et en compter le nombre ? Les anciens systèmes regroupaient souvent plusieurs brochettes en un seul objet et allaient même jusqu’à confondre la pique en bois avec la nourriture.

La nouvelle génération de modèles Viscovery parvient à distinguer chaque brochette individuellement, à séparer l’aliment des supports (comme les pics en bambou) et à éviter de prendre les ombres pour des aliments. Cette précision marque une avancée majeure dans la fiabilité de la reconnaissance.

4. Sushis : combien de pièces ? Et lesquelles ?

Les assortiments de sushis, souvent variés et très serrés, représentent un double défi :

  • Identifier la catégorie (saumon, thon, tamago, futomaki…),
  • Compter le nombre de pièces de chaque type.

Une erreur dans le comptage peut fausser la validation d’un plat ou le calcul du prix.
La brillance des plateaux, les sauces, les chevauchements complètent les difficultés.

Grâce à des outils propriétaires, Viscovery enrichit continuellement son système avec de nouvelles images issues de l’usage réel — permettant une IA qui s’améliore à chaque scan.

La reconnaissance alimentaire par IA : simple en apparence, exigeante en pratique

Faire comprendre à une IA le contenu exact d’un plat — et en quelle quantité — reste un défi considérable, que l’on parle de bentos, d’assiettes de cantine, de brochettes ou de sushis. L’enjeu dépasse la simple reconnaissance d’images : il s’agit d’interpréter des aliments instables, mélangés, superposés et jamais identiques.

La bonne nouvelle : ces défis sont aujourd’hui maîtrisés, permettant à un nombre croissant d’établissements — restaurants, ramen shops, cantines d’entreprise — d’accélérer l’encaissement, réduire les erreurs humaines et optimiser le contrôle des plats.

Dans le prochain article, nous verrons un nouveau tournant :
que se passe-t-il quand l’IA passe de la reconnaissance des aliments… à celle des bols, assiettes et contenants ?

(Cet article a été traduit en français par ChatGPT.)