Prediction of allergenic composition in food products using natural language processing based on LSTM
Файли
Дата
2024
Автори
DOI
item.page.thesis.degree.name
item.page.thesis.degree.level
item.page.thesis.degree.discipline
item.page.thesis.degree.department
item.page.thesis.degree.grantor
item.page.thesis.degree.advisor
item.page.thesis.degree.committeeMember
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
The growing global prevalence of food allergies, with symptoms ranging from mild to severe, is a challenge for scientists, healthcare professionals, food manufacturers and legislators. Regulations, including Ukraine’s Law № 2639-VIII and EU Regulation (EU) № 1169/2011, govern allergen labeling. This study presents an innovative application of Long Short-Term Memory (LSTM) neural networks for predicting allergens in food products based on textual descriptions of their compositions. The research leverages a dataset sourced from Kaggle, which includes names and detailed descriptions of food items, and processes it through an LSTM-based neural network architecture. The architecture consists of an embedding layer, an LSTM layer, and dense layers with a Dropout layer included to prevent overfitting. The model is trained using a binary cross-entropy loss function to evaluate its performance, eventually achieving an accuracy of 98.75% with a low loss of 0.0414. These results underscore the potential of LSTM networks in the field of food safety, offering a robust tool for allergen identification that could assist consumers in making safer dietary choices and managing food allergies more effectively. The findings highlight the growing importance of artificial intelligence and machine learning in enhancing public health measures and the management of food allergies.
Зростаюча глобальна поширеність харчової алергії, симптоми якої варіюються від легких до важких, є проблемою для вчених, медичних працівників, виробників продуктів харчування та законодавців. Норми, зокрема Закон України № 2639-VIII та Регламент ЄС (ЄС) № 1169/2011, регулюють маркування алергенів. Це дослідження представляє інноваційне застосування нейронних мереж довготривалої короткочасної пам’яті (LSTM) для прогнозування алергенів у харчових продуктах на основі текстових описів їх складу. Дослідження використовує набір даних, отриманий від Kaggle, який містить назви та детальні описи харчових продуктів, і обробляє їх за допомогою архітектури нейронної мережі на основі LSTM. Архітектура складається з шару вбудовування, шару LSTM і щільних шарів із включеним шаром Dropout, щоб запобігти переобладнанню. Модель навчається за допомогою двійкової функції перехресних ентропійних втрат для оцінки її продуктивності, зрештою досягаючи точності 98,75% з низькими втратами 0,0414. Ці результати підкреслюють потенціал мереж LSTM у сфері безпечності харчових продуктів, пропонуючи надійний інструмент для ідентифікації алергенів, який може допомогти споживачам зробити безпечніший вибір дієти та ефективніше керувати харчовою алергією. Отримані дані підкреслюють зростаючу важливість штучного інтелекту та машинного навчання для покращення заходів охорони здоров’я та боротьби з харчовою алергією.
Зростаюча глобальна поширеність харчової алергії, симптоми якої варіюються від легких до важких, є проблемою для вчених, медичних працівників, виробників продуктів харчування та законодавців. Норми, зокрема Закон України № 2639-VIII та Регламент ЄС (ЄС) № 1169/2011, регулюють маркування алергенів. Це дослідження представляє інноваційне застосування нейронних мереж довготривалої короткочасної пам’яті (LSTM) для прогнозування алергенів у харчових продуктах на основі текстових описів їх складу. Дослідження використовує набір даних, отриманий від Kaggle, який містить назви та детальні описи харчових продуктів, і обробляє їх за допомогою архітектури нейронної мережі на основі LSTM. Архітектура складається з шару вбудовування, шару LSTM і щільних шарів із включеним шаром Dropout, щоб запобігти переобладнанню. Модель навчається за допомогою двійкової функції перехресних ентропійних втрат для оцінки її продуктивності, зрештою досягаючи точності 98,75% з низькими втратами 0,0414. Ці результати підкреслюють потенціал мереж LSTM у сфері безпечності харчових продуктів, пропонуючи надійний інструмент для ідентифікації алергенів, який може допомогти споживачам зробити безпечніший вибір дієти та ефективніше керувати харчовою алергією. Отримані дані підкреслюють зростаючу важливість штучного інтелекту та машинного навчання для покращення заходів охорони здоров’я та боротьби з харчовою алергією.
Опис
Ключові слова
кафедра експертизи харчових продуктів, food allergies, allergenic proteins, legislation, artificial intelligence (AI), long short-term memory (LSTM), neural network architecture, allergen prediction, харчові алергії, алергенні білки, законодавство, штучний інтелект (AI), довготривала короткочасна пам'ять (LSTM), архітектура нейронної мережі, передбачення алергенів
Бібліографічний опис
Krysanov, D. Prediction of allergenic composition in food products using natural language processing based on LSTM / D. Krysanov, O. Melnyk // Black Sea Science 2024 : proceedings of the International competition of student scientific works. – Odesa : ONUT, 2024. – P. 49–57.