Каталог Данных Каталог Организаций Каталог Оборудования Каталог Программного Обеспечения Написать письмо Наши координаты Главная страница
RSS Реклама Карта сайта Архив новостей Форумы Опросы 
Здравствуйте! Ваш уровень доступа: Гостевой
Навигатор: Новости/
 
Rus/Eng
Поиск по сайту    
 ГИС-Ассоциация
 Аналитика и обзоры
 Нормы и право
 Конкурсы
 Дискуссии
 Наши авторы
 Публикации
 Календарь
 Биржа труда
 Словарь терминов
Проект поддерживают  



Авторизация    
Логин
Пароль

Забыли пароль?
Проблемы с авторизацией?
Зарегистрироваться




width=1 Rambler_Top100

наша статистика
статистика по mail.ru
статистика по rambler.ru

Реклама на сайте
Новостные ленты

IBM разработала датасет Project CodeNet для обучения нейросетей программированию

Как сообщает habr.com, IBM представила датасет Project CodeNet, который поможет обучать системы искусственного интеллекта программированию. Компания объявила на конференции Think 2021, что ей удалось создать аналог Rosetta Stone для кодинга.

Научный сотрудник IBM Ручир Пури сравнил новый датасет с набором для обучения систем компьютерного зрения ImageNet.

CodeNet представляет собой обширный набор данных, предназначенный для обучения систем искусственного интеллекта тому, как переводить код. Датасет включает около 14 млн фрагментов кода и 500 млн строк на 55 языках — от COBOL и FORTRAN до Java, C ++ и Python. В нем содержится около 4 тысяч задач кодирования.

По словам Пури, использование разных языков позволит задействовать системы на ИИ в парных операциях. К примеру, можно взять код на COBOL и перевести его на Java, либо наоборот.

Но, как и в случае с человеческими языками, компьютерный код создается в определенном контексте. CodeNet может использоваться для поиска фрагментов кода и обнаружения клонов, а также в качестве эталонного набора данных. Кроме того, каждый образец помечен временем работы процессора и объемом памяти, что позволяет исследователям проводить регрессионные исследования и разрабатывать системы автоматической коррекции кода.

Наконец, пользователи смогут запускать отдельные образцы кода «для извлечения метаданных и проверки правильности выходных данных генеративных моделей ИИ».

Хотя этот набор данных теоретически можно использовать для генерации совершенно новых последовательностей кода, основное достоинство CodeNet заключается в способности переводить.

IBM делает данные CodeNet общедоступными, репозиторий размещен на GitHub.


Разделы, к которым прикреплен документ:
Новости
Организации
Тематич. разделы / Технологии
Страны и регионы / Др. страны
 
Комментарии (0) Для того, чтобы оставить комментарий Вам необходимо авторизоваться или зарегистрироваться




ОБСУДИТЬ В ФОРУМЕ
Оставлено сообщений: 0


Источник: https://habr.com/ru/news/t/556678/ 15:03:30 11.05 2021   

Версия для печати  
    Анонсы партнеров

    Наши предложения
  Новости Gisa.ru в Телеграм
  Реклама на сайте
  Зарегистрироваться и получать новости по e-mail
  Конференции ГИС-Ассоциации
  Журнал "Управление развитием территории"
  Контакты

Портал Gisa.ru использует файлы cookie для повышения удобства пользователей и обеспечения работоспособности сайта и сервисов. Оставаясь на сайте Gisa.ru вы подтверждаете свое согласие на использование файлов cookie. Если вы не хотите использовать файлы cookie, то можете изменить настройки браузера. Пользовательское соглашение. Политика конфиденциальности.
© ГИС-Ассоциация. 2002-2022 гг.
Time: 0.02061915397644 sec, Question: 62