哈佛大学“机构书1.0”的开源AI培训数据集从您的

科技 365bet网页版 浏览

小编:6月16日,哈佛法律学院图书馆上周在微软和Openai的支持下正式开放。

6月16日,Home报告说,在Microsoft和Openai的支持下,哈佛法律学院图书馆上周正式打开了第一组开放式培训数据,即机构书1.0。数据集包括哈佛大学系列中的983,000本书,其中涵盖了245种语言,总计2420亿个令牌,其房屋附在项目管理上。报告显示,相应数据集收集的书中有40%是英文。发表的主要年份集中在十九世纪和二十世纪,共有20个主题分为20个问题。此外,相应的数据集还为每本书提供完整的元数据,包括“作者,出版年份,语言,原始资料”等信息。哈佛大学法院图书馆说,研究人员将继续在Ethe的未来扩大他们的数据。目前,相应项目团队的成员正在与波士顿公共图书馆合作以前数据集的数字格式的历史报纸的DD“数百万”。哈佛法律学院图书馆还计划开发一套AI工具,以提高收集到的数据的分类和打开的效率,并促进“使用负责数据的标准”。

当前网址:https://www.shenyuhua.com//a/keji/236.html

 
你可能喜欢的: