Автор: Татьяна Гирко, Берн-Цюрих-Лозанна, 09.02.2017.
Оливье Вершер (© Merlin Photography Ltd.)
Наука о данных (англ. data science) – относительно новая дисциплина, которая начала развиваться в связи с появлением больших данных (англ. big data). Под этим термином скрываются огромные объемы неструктурированных данных, справиться с анализом и обработкой которых традиционными методами не так просто. Основные характеристики больших данных – их объем, скорость (имеется в виду их доступность практически в реальном времени) и разнообразие.
В начале Второй мировой войны британские спецслужбы объединили под руководством математика, криптолога и «отца» информатики и искусственного интеллекта Алана Тьюринга талантливых людей, которые работали над дешифровкой сообщений машины Enigma, использовавшейся немецкой армией. Специалистов отбирали среди любителей кроссвордов, которым удавалось быстрее, чем за 12 минут, справиться с головоломками, публикуемыми в газете Daily Telegraph (смотревшие вышедшую на экраны в 2014 году историческую драму «Игра в имитацию» наверняка вспомнят этот эпизод).
Кадр из фильма The Imitation Game
Восемьдесят лет спустя компании точно также ищут талантливых математиков и специалистов в области статистики, которые способны выделить важную информацию в огромном массиве данных. Многие современные игроки – от банков до телекоммуникационных компаний – уделяют все больше внимания работе с большими данными. Например, страховщик Suva сообщил, что в 2015 году благодаря автоматической системе обнаружения и отклонения необоснованных запросов ему удалось сэкономить 40 млн франков.
Такие примеры использования больших данных приводятся в журнале ICT Journal. Работают с ними и в ЦЕРНе: об этом в интервью Нашей Газете.ch недавно рассказывал сотрудник расположенной в Женеве физической лаборатории.
Иными словами, золотоносный рудник найден, осталось подготовить специалистов (data scientists), способных извлечь из него пользу (читай – золото), то есть получить некие знания из огромного набора данных. Аналогия с рудником не случайна: существует даже специальный термин Data Mining, обозначающий совокупность методов обнаружения в данных ранее неизвестных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Национальный центр науки о данных, об открытии которого было объявлено на этой неделе в Берне, позволит углубиться в изучение новой области и даст толчок развитию междисциплинарных исследований и открытой науки. Последнее словосочетание – еще один новый термин, означающий свободный доступ к результатам научных исследований не только для профессионалов, но для широкой публики. Все это, в свою очередь, можно будет использовать в разных сферах – от персонифицированной медицины до вопросов охраны окружающей среды, говорится в совместном пресс-релизе Федеральных политехнических школ Цюриха и Лозанны, ставших инициаторами создания нового центра. Кстати, начиная со следующего учебного года в обоих вузах появится магистерская программа науки о данных. Добавим, что новое направление уже изучают в Университете прикладных наук Цюриха (ZHAW) и Высшей специализированной школе Берна.
Наука о данных находится на пересечении многих академических дисциплин, таких как управление и инжиниринг данных, статистика, машинное обучение, алгоритмы, оптимизация и визуализация. Она предлагает новые инструменты для социальных и экономических наук, медицины и других направлений. В этом контексте ее значение переоценить трудно: многие научные и исследовательские институты вкладывают сегодня значительные средства в создание таких центров и разработку соответствующих программ. Директор SDSC Оливье Вершер объяснил в эфире телерадиокомпании RTS, что одна из основных задач его подразделения заключается в преодолении пропасти, которая существует сегодня между экспертами в своих областях – например, врачами, которые могли бы использовать данные для выбора способа лечения, наиболее подходящего конкретному пациенту, – и непосредственно учеными, работающими в сфере больших данных.
Лино Гузелла (© Merlin Photography Ltd.)
Один из наиболее заметных вызовов, с которыми столкнулось новое направление, – необходимость разработки «общего» языка, на котором могли бы общаться поставщики данных и IT-специалисты. «Мы зависим от единой экспертизы специалистов, помогающих нам вычленить определенные элементы в наборе данных. Новый центр науки о данных объединяет этих специалистов, становясь таким образом междисциплинарной платформой, которая также будет поощрять трансфер знаний», – заявил на церемонии открытия президент Федеральной политехнической школы Цюриха (ETHZ) Лино Гузелла. Всего в SDSC будут работать 30-40 специалистов разного профиля, физически находящихся в Лозанне и в Цюрихе. Оливье Вершер, возглавляющий новый центр, закончил EPFL и 17 лет работал в IBM.
Платформа, о которой идет речь, находится в облаке, или облачном хранилище данных, Insights Factory. Согласно пресс-релизу, это «единое окно, позволяющее хранить, изучать и анализировать организованные, откалиброванные и анонимные данные». По словам президента Федеральной политехнической школы Лозанны Мартина Веттерли, создание новой платформы является фундаментальным этапом в развитии открытой науки. «Широкий доступ к научным знаниям должен опираться на устойчивую, надежную и контролируемую инфраструктуру. Благодаря этому центру, Швейцария обзавелась инструментом, который соответствует ее амбициям», – отметил он.
Pourquoi la guerre ?
К чему война?
Где в Швейцарии дешевле всего снимать квартиру?
300 богатейших жителей Швейцарии-2024
Швейцарский дом Одри Хепберн выставлен на продажу
Трамп против ООН и чрезмерной благотворительности
Добавить комментарий