信息网_www.60328.cn

郑州信息网 > 热点信息 > 正文

百度开源进行时

网络整理 2020-09-28 19:03

“Human knowledge belongs to the world!” 在电影《反托拉斯运动》中,主人公在片尾大声喊出的话,多年以后成了开源世界的“终极理想”。AI 接棒移动互联网席卷着滔天巨浪而来,开源也从起初少数人关注的活动边缘变成了硝烟弥漫的中心战场,开源变成了互联网支撑技术的同时也不断渗透到我们的生活,开放的开源技术让价值回归到开发者个人,也为我们日常使用的电脑、移动设备,及其所连接的网络提供了源源不断的“动力”。

近些年来科技巨头蜂拥而至,国外 Facebook、谷歌、苹果、微软为升级迭代 AI 开源框架各显神通,开源了其 AI 软件和服务器硬件设计。国内的开源项目亦毫不示弱,BAT 在前,华为、头条、美团紧随其后,无论在技术的积累、资本的投入,还是在人才的聚合上都强势发力,助推“开源”进入新的阶段。

在开源的江湖,珠玉在前,后继四起,但百度从未缺席。InfoQ 通过分析 GitHub 上的开源项目数据集 GitHubArchive,得出 2020 和 2019 年度全球深度学习框架排名榜单(见下文),其中,百度飞桨 PaddlePaddle 均力压谷歌 TensorFlow,紧随 Facebook PyTorch 之后,其抢眼的数据表现意味着在开发者积极贡献代码和项目、社区活跃、代码迭代速度上一直保持着强劲的竞争力,已经成为了国内第一、世界第二的深度学习开源框架,将国内开源的“终极理想”往前又推进了一步。

1.百度强力开源 ,机遇和挑战并存

从 2009 年大规模定制 Hadoop 开始到 2013 年率先开源 ECharts ,百度的开源之路从未停止过。2017 年更是百度开源的突破之年,从深度学习平台飞桨 PaddlePaddle,到 Apollo 自动驾驶,百度落实了多项重大开源技术,也将 AI 开源提升到前所未有的战略高度。

除此之外,百度还参与了国内外顶级开源基金会和组织,成为了 Apache 基金会、Linux 基金会以及云原生计算基金会的金牌会员,以及开放原子基金会的理事单位。百度旗下 ECharts、Doris、BRPC、Teaclave 等多个项目已经成为 Apache 基金会孵化项目,Baetyl、IME、EDL 等项目也捐赠给了 Linux 基金会进行孵化。今年 6 月 24 日,BFE 开源项目被云原生计算基金会正式接纳为 Sandbox Project。百度完全自主研发的超级链技术将依托于开源基金会以全新的组织形态进行运作。此项目将作为开放原子基金会区块链领域首个捐赠项目进行孵化,并在全球开展开源技术和生态的运营及推广活动。

2019 年,百度战略投资了开源中国,作为中国最大的开源技术社区,开源中国旗下运营的 Gitee 代码托管平台是全球仅次于 GitHub 的代码托管平台,每日约增加 5000 名开发者、200 家企业客户、1.7 万代码仓库,已经具备了在国际市场与 GitHub 全面抗衡的基础。

引入开源,加快技术迭代和演进一直是百度秉承的“理念”,这里面不仅有百度的基因和能力因素,更重要是表达一种开放的态度。百度从布局 AI 开始,就一直坚持开放的战略,在研发 AI 技术的同时,通过百度大脑 AI 开放平台、飞桨产业级深度学习开源开放平台、Apollo 自动驾驶开放平台、小度开放平台以及各类开源框架和数据集等,向广大开发者和企业用户开放 AI 能力,提供技术和解决方案,赋能各行各业转型升级。

再者,开源某种程度上能有效减少闭源垄断市场的局面出现,百度深深了解在技术领域一枝独秀不是春,没有对外开源,很多技术和产品不会拓展如此之快,在别人的肩膀上做创新,有助于构建 AI 技术生态 。在建立生态和开拓市场基础上的开源会让市场更加欣欣向荣,获得更长足的发展。

2.荡起“飞桨”,AI 赋能量子计算

如果 GitHub 开发者想要对开源项目贡献代码,需发起 pull request 把自己修改的代码合入分支主,如果 pull request 被合入,则表示代码被采用,成功完成一次开源贡献。因此,pull request 的发起(open)数量是评估开发者积极贡献代码、项目和社区活跃最直观的指标,合入(merged)pull request 是评估开源项目的代码迭代速度的一个极佳的权威性指标。

InfoQ 通过分析 GitHub 开源项目数据集 GitHubArchive 之中关于 pull request 的发起和合入数据,获得了 2020 和 2019 年度全球深度学习框架活跃度排名榜单,其中,百度飞桨的 open 数据由去年的 2759 次跃升到今年同期的 3391 次,比现阶段暂列第三的谷歌 Tensorflow 高出 1000 多次。飞桨的 merged 数据由 1924 次跃升为 2428 次,力压暂居第一 Pytorch 的 238 次,比第三名 Tensorflow 高出近 1000 次,这也意味着“动静统一、软硬融合”的飞桨一直在致力于让深度学习技术的创新与应用更简单,其提供的 AI 底层技术也深受开发者欢迎。

图片10.png

2020/2019 年度全球开源深度学习框架活跃度排名榜单(InfoQ 提供)

Tags:

转载请标注:信息网——百度开源进行时

搜索
网站分类
标签列表