То, что ранее вызывало скептицизм, сейчас стало нашей реальностью: виртуальные хранилища данных, системы удаленного управления, модели машинного обучения — всё это уже является неотъемлемой частью процессов разведки и добычи УВ, причём основное внимание приковано к большим языковым моделям, генеративному ИИ и облачным решениям. Перед отраслью открываются новые перспективы, и, в то же время, появляются новые вызовы.
Эксперты обменялись инсайтами о готовности нефтегазовых компаний к переходу в облако, и выразили мнение о том, что потенциальные выгоды от перехода пока значительно ниже, чем потенциальные риски и требования информационной безопасности. Эксперты провели сравнение нефтегаза и других секторов экономики и пришли к выводу, что переход к облачным технологиям — это не вопрос из серии «быть или не быть?». Это неизбежность и фактически вопрос времени. Причём при должном уровне подготовки и формирования стандартов переход к облачным хранилищам может осуществиться довольно быстро.
Достаточно ли нам данных, и насколько они качественны? Эксперты сошлись во мнении, что основной проблемой является отсутствие общедоступных датасетов для обучения и тренировки моделей ИИ. Проекты становятся более комплексными. Без датасетов и бенчмарков невозможно оценить эффективность применения новых технологий. Данные и их источники слишком разнообразны, чтобы обойтись одним датасетом, и именно легкий доступ к данным обеспечивает долгосрочный эффект.
Здесь и сбор данных из множества источников, валидация и верификация информации, интеллектуальный поиск, обеспечение целостности и связности данных, предоставление данных системам-потребителям по современным информационным протоколам.
Технологии и области применения. Рассмотрели как сами технологии, так и области их применения на примере набора микросервисов проектов ГРР, добычи и ГИР. Большие языковые модели нашли своё применение в пайплайнах RAG, CoT, ToT, дообучении ретриверов, генераторов, а также в бенчмарках и датасетах.
Технологии компьютерного зрения используются в обученных моделях, мультимодальных сетях и датасетах. Графовые методы внедрены в фреймворки и архитектуры мультиагентных систем, а агентные ситсемы — в фреймворки/подходы для построения графов знаний. Интеллектуальный анализ данных используется в моделях для решения различных промысловых задач (напр. аномалии в PVT).