新闻资讯

群雄混战AI开源框架,中国AI开源面临的困境(5)

2019-11-14 admin

除了Angel之外,腾讯还开源了面向手机端的跨平台高性能神经网络前向计算框架NCNN、首个医疗AI深度学习预训练模型MedicalNet、AI围棋程序Phoenix Go、包含800多万中文词汇的高质量中文词向量NLP数据集、业内最大规模的多标签图像数据集ML-Images、全球首款自动化深度学习模型压缩框架PocketFlow。

群雄混战AI开源框架,中国AI开源面临的困境

阿里巴巴在Github上主体账号的总项目数是国内最多的,据贾扬清介绍,在AI和大数据领域,阿里已经贡献超过100万行的代码,深度参与超过10个开源项目。


贾扬清在今年9月的阿里云栖大会上说,阿里的AI与开源、开放的生态是分不开的,会通过开源与云平台的合作,推进开发者生态建设,在拥抱开源的同时贡献开源。


单从近一年来看,阿里在AI领域先后开源面向高维稀疏数据场景的深度学习框架XDL、轻量级深度神经网络推理引擎MNN、基于PAISoar的分布式神经网络仓库PAI-FastNN。


而随着阿里云与Facebook宣布在AI开源项目上展开合作,双方计划开源、共享、合作开发框架、AI模型、文件等,将成果以 PyTorch 的形式共享到 GitHub,阿里云机器学习平台将能支持PyTorch框架。这会进一步降低AI开发和应用门槛,同时推动PyTorch框架在产业界的普及。


另外,阿里也通过携手Facebook,拟将PyTorch项目文献、教程等资料更快、更准地翻译成中文版本,让国内开发者能第一时间学到最新PyTorch。

群雄混战AI开源框架,中国AI开源面临的困境

商汤和港中大看起来也是PyTorch拥护者,开源的最大目标跟踪库PySOT、物体检测工具包MMDetection、时空图卷积网络(ST-GCN)骨架动作识别MMSkeleton均基于PyTorch。


就现在来看,国内自主研发开源深度学习框架的企业还属于“稀缺物种”。


目前有苗头成为新成员的是华为和旷视,华为预告将在明年第一季度开源其全场景AI计算框架MindSpore,旷视的深度学习框架Brain++也已经在计划开源,此前旷视研究院的原创ShuffleNet Series算法已经开源在Github上。


05、产学研合力加速中国AI开源进程


除了开源AI项目之外,国内外公司也在积极参与AI开源社区建设。


比如,百度、腾讯、华为、中兴、AT&T等国内外知名企业均加入了LF深度学习基金会,共同打造中立开源社区。


目前广泛存在的专利许可费高昂、专业人才有限等问题,均可在AI开源社区的帮助下有效改善。另外,开源还会帮助数据科学家、工程更高效地做大规模系统性测试、性能调优、实际落地等工作,带给他们更好的用户体验。


在扶持开发者和创企的同时,开源社区也从其模式中构建了庞大的反馈循环。开发者及团队带给社区建设者的反馈,是解决问题中的想法、改进平台的建议、更多的数据、更成熟或更创新的模型和算法、甚至更多的用户,这些反馈会反过来推动开源社区主导者对技术的理解和业务的优化,为后续的数据采集及技术分析铺路。

群雄混战AI开源框架,中国AI开源面临的困境

根据最新发布的Github年度报告,我国在开放源代码的使用量上遥遥领先,开发者fork和clone的项目比去年多了48%。


过去一年,亚洲开发者社区在2019年增长迅速,约36%的私人存储库创建自中国、印度、日本等亚洲开发者。

群雄混战AI开源框架,中国AI开源面临的困境

▲自2014年以来,Github上亚洲的贡献者群体的年增长率已超过欧洲和北美的贡献者群体


考虑到国内AI开源发展现状距离国际最领先水平还有距离,政产学研的力量正更为紧密的集结在一起。