기후위기시계
실시간 뉴스
  • 최근 출시된 MagicHub.io, 머신 러닝 위한 무료 데이터세트 제공

(베이징 2021년 5월 3일 PRNewswire=연합뉴스) MagicHub.io가 지난달 15일에 출시됐다. MagicHub.io의 창설 기업인 Magic Data Tech는 대화 발화 데이터양 부문에서 선도적 입지를 구축하고, 독자적인 웹사이트에서 개방 소스 데이터세트를 공개하는 최초의 중국 기업이다. 이를 통해, 사용자가 데이터를 확보하는 방식이 변화될 것으로 기대된다.

MagicHub.io에서는 다양한 데이터세트를 다량으로 공개한다. 데이터세트는 여러 영역으로 세분돼있어, 다양한 AI 모델에 대한 데이터세트를 찾을 수 있는 더욱 효율적인 방법을 AI 엔지니어에게 제공하며, 이를 통해 알고리듬 최적화를 위한 에너지를 더욱 비축할 수 있다.

Magic Data Tech는 모든 발견의 데이터 생산자가 MagicHub.io에 합류해 데이터세트를 공개할 것을 장려한다. 함께 힘을 모으면, 개방 소스를 위한 더 훌륭한 생태계를 구축할 수 있다. 관심이 있는 경우 Magic Data Tech에 문의하도록 한다.

MagicHub.io는 만다린 중국어, 영어 및 상하이 방언(우어) 대화 발화, NLP 텍스트 말뭉치, TTS 말뭉치 및 어휘를 포함해 30개가 넘는 개방 소스 데이터세트를 공개했다. 모든 데이터세트는 언어, 장면 및 산업별로 구분된다.

Magic Data Tech는 MagicHub.io에서 고품질 데이터세트와 더 많은 콘텐츠를 공개하고 있으며, 댓글, 공유 또는 다른 모든 형태의 지원에 항상 감사하고 있다. 서로 힘을 합하면 MagicHub.io를 영감과 공유 정신을 지원하는 더 좋은 사이트로 발전시킬 수 있다.

1969년 Unix가 Unix Community에서 소스 코드를 공개하면서, 인류 역사상 최초의 '개방 소스 행위'가 시작됐다.

1991년에는 Linux kernel이 공개됐다.

1998년에는 Netscape Communications가 '개방 소스'라는 단어를 정의한 Communicator 라인을 위한 소스 코드를 공개했다.

2005년에는 Git라 불리는 소스 코드 관리 시스템이 공개됐고, 관리 Git 코드 웨어하우스가 만들어졌다.

인공 지능(AI)이라는 개념이 Dartmouth Summer Research Project에 포함된 후로 수많은 기복을 겪었다. 인터넷, 빅 데이터, 클라우드 컴퓨팅, 5G 등 수많은 신기술이 나왔고, 점점 중요한 역할을 맡고 있다.

AI가 새로운 시대를 열면서 개방 소스가 등장했다. 머신 러닝을 위한 플랫폼이 나오고 있다. 세대별 개발자는 개방성, 자유 및 협력이라는 정신으로 AI의 진화를 위해 자신들의 지능으로 기여하고 있다. 있다. 대중에 이미지, 텍스트 및 오디오 데이터를 공개하는 정부, NGO, 기업, 학술 기관 및 개인이 점점 증가하고 있으며, 이들은 Kaggle, UCI, OpenML, ImageNet, OpenSLR 같은 플랫폼을 구축했다. 앞으로 데이터는 AI 발전의 핵심 동력이 될 전망이다.

문의: Magicdata, +86-13552961476

출처: Magic Data Technology

연재 기사