В СО РАН создадут единую информационную систему с использованием технологии больших данных

Создание единой системы передачи, хранения и обработки больших объемов данных (big data) в Сибирском отделении Российской академии наук (СО РАН) позволит развивать научные исследований на самом современном уровне, пишет официальное издание СО РАН "Наука в Сибири".

"Информационно-телекоммуникационная система СО РАН строилась и совершенствовалась десятилетиями. В Новосибирском научном центре создана мощная и организованная информационно-вычислительная среда. Она опирается на телекоммуникационные ресурсы Института вычислительных технологий СО РАН (ИВТ) и все больше востребована", - приводятся в материале слова научного руководителя ИВТ, академика РАН Юрия Шокина.

"Поэтому наша задача - "наращивать мускулатуру" упреждающими темпами, для чего в программу развития научной инфраструктуры "Академгородка 2.0" внесен проект создания Сибирского национального центра высокопроизводительных вычислений, обработки и хранения данных (СНЦ ВВОД)", - сказал Шокин.

Общая сеть СО РАН

Общая коммуникационная сеть институтов СО РАН формировалась с 1990-х годов по инициативе председателя СО РАН, академика Валентина Коптюга. "Это, в принципе, была первая в России мощная корпоративная сеть, которая и сегодня остается самой крупной в рамках Академии наук. Участниками этой сети являются около 65 организаций в 11 городах, а до происшедших в ходе реформы РАН укрупнений в сети работало более 100 научных учреждений", - сказал заместитель директора ИВТ Андрей Юрченко.

Он отметил, что после анализа ситуации выяснилось, что внешний трафик институтов в разы меньше объемов информации, идущей к ним и от них по внутренней сети.

"Это происходит прежде всего из-за интенсификации работы с большими данными. Большие данные становятся основой научной деятельности, и их начинают генерировать и обрабатывать практически все: биологи, физики, геологи и многие другие. В последнее время быстро нарастают запросы наших медиков - они работают уже с терабайтами", - пояснил Юрченко.

Издание отмечает, что создание академическими институтами СО РАН собственных системы работы с большими данными представляется сложной задачей.

"Да, тот же ФИЦ "Институт цитологии и генетики СО РАН" - учреждение, достаточно крупное, чтобы позволить себе организацию собственного хранилища данных. Но даже такому институту-гиганту непросто удовлетворить быстро нарастающие потребности: мне известно, что ФИЦ ИЦиГ уже в следующем году будет нуждаться в не менее чем 2,5 петабайтах пространства для долговременного хранения своих данных, а таких ресурсов там нет, и не предвидится", - сказал Юрченко, отметив, что аналогичная проблема есть и у Института ядерной физики им. Г. И. Будкера СО РАН, где заявляют о необходимости иметь хранилища в сотни петабайтов для данных с сенсоров различных ускорителей.

"Мы сторонники разумной централизации и понимаем, что совсем необязательно все ресурсы сваливать в одну кучу. Однако эффективное управление данными и вычислениями - непростая научно-техническая задача, поручать решение которой целесообразно специалистам, каковых нужно держать вместе, чтобы они постоянно варились в одном котле, работали как одна профессиональная команда", - считает заместитель директора ИВТ.

СЛЕДУЮЩИЙ МАТЕРИАЛ РАЗДЕЛА "IT"