美文网首页人工智能与科技
机器学习为什么要开源?如何选择学习框架?

机器学习为什么要开源?如何选择学习框架?

作者: 两颗花椰菜 | 来源:发表于2018-12-11 15:48 被阅读7次

机器学习(ML)继续以其能力令我们惊叹,并将改变许多行业的经济结构 - 从小部件生产商到金融分析师和医疗保健提供者。 但许多IT和运营从业者正在努力将ML的快速进步用于他们的组织。

要在您的环境中利用ML,您应该首先了解您要实现的目标,例如提高效率,准确性和安全性,或降低产品/服务的交付成本。 接下来,你将如何到达那里? 集成开源代码库? 购买产品或服务? 使用公共云?

这些决策需要反映ML域的现实,您的业务需求和您可用的技能。

ML只是一个环节,而不是整个解决方案

重要的是要了解ML / AI不是您可以购买的产品。 必须仔细评估“AI for Y”创业公司的杂音,这些创业公司的目标是利用伴随着ML最近突破的大肆宣传。 成功应用ML的关键是为您的特定用例定制一组算法。 使用ML的完全打包的图像识别产品可能正是您所需要的 - 但如果您需要基于ML的应用程序从您的设备中提取高度自定义数据以查找特定趋势,您将无法购买产品 现成的。 重要的是整个解决方案 - 根据我的经验,ML只是一个因素。

由于ML发展如此之快,我相信解决方案应该能够利用开源中提供的强大技术。 确保您的解决方案是“ML敏捷”,并且能够轻松升级到更新的算法。 允许您插入主要开源框架的应用程序体系结构可以节省多年的工作量,并使您的解决方案更快地投入生产。

采用任何基于ML的解决方案的主要挑战是为您的环境构建和调整模型所需的工作 - 这需要高技能的工程师/数据科学家。 出于这个原因,坚持要求您的集成商在其整个生命周期内管理解决方案,并且在您有证据证明其有效之前不要在定制的应用上签字。 请记住,您可能不知道解决方案是否会带来显着的好处,直到您看到它在实践中工作足够长的时间来确定误报和漏报的运营成本。

开源的力量

今天,ML算法和工具的创新前沿将在开源代码库中找到,并得到广泛的支持。 社区开发模型吸引了研究人员,最终用户和开发人员 - 用户可以确信他们不会陷入死胡同的专有堆栈,开发人员可以放心地将时间和精力投入到广泛使用的代码库中,开发技能集。 便携式跨项目,雇主甚至云。 开源ML工具不仅是算法开发的前沿,而且体现了许多数据科学家的事实上的工作实践。

值得注意的是,在一套通用的开源工具上进行近乎普遍的合作并不会使ML本身商品化。当然,代码是免费的,但社区发展模式发生了翻天覆地的变化:领先的研究人员和从业人员共同努力,为所有人提供免费的公共代码库。这是一个引人入胜的趋势,也为主要贡献者(如谷歌,亚马逊和微软)的竞争利益服务,通过确保拥有专有解决方案的竞争对手无法跟上,从而获得优势。对于云提供商而言,基于ML的工作负载是通过中央处理单元,内存和图形处理单元/张量处理单元(TPU)资源从云基础架构中获利的绝佳方式。

最后,请注意算法的免费可用性并没有扼杀价值链。芯片供应商,包括谷歌及其TPU,NVIDIA和40多家致力于ML的硬件加速的初创公司,旨在通过云或本地设备的专有加速硬件将资源匮乏的培训和推理货币化。

2016年,谷歌推出了Tensor Processing Units,或称TPU,它们更为人所知的一点是 - 专为Google的TensorFlow框架设计的芯片。 今年,这家技术巨头现在推出了Edge TPU,这是一种小型人工智能加速器,可在物联网(IoT)设备中实现机器学习工作。

Edge TPU旨在执行机器学习算法训练的任务。 例如,它将能够识别图片中的对象。 算法训练的这部分“预成形任务”被称为“推理”。 虽然Edge TPU旨在执行推理,但Goggle基于服务器的TPU负责训练算法。

ML的下一步是什么?

成功的开源项目吸引了开发人员和研究人员,成功的ML开源软件项目成为行业创新的焦点,加速了最先进的技术,并为所有利益相关者提供了集体贡献的力量。对比强大的社区对Google TensorFlow的支持以及几乎完全没有围绕专有IBM Watson的社区。将TensorFlow集成到一整套消费者和企业解决方案中将构建对Google服务和TPU的偏好,让开发人员专注于Google技术并赋予Google巨大的营销权利 - 在其社区的每一次ML成功中推广自己。

云提供商拥有庞大的营销预算和巨大的覆盖范围,他们已经使用ML来区分他们的打包服务 - 将AI智能嵌入到通过订阅许可模式货币化的应用程序中。这种方法使客户不必理解该技术。通过整合ML功能,快速进入SaaS应用程序,提供商还可以与用户建立强大的亲和力。

开源ML是有利于执行和开发效率的竞赛的辅助剂。 获奖者将利用现成的强大工具,以合理的成本快速提供经济效益。 那些坚持专有秘密酱的口头禅可能会在战术上取得成功,但我相信它们注定最终会失败 - 采用率降低,开发人员支持减少。

尽管主要开源框架中的算法构成了极具价值的社区公共资源,但它是一个对您的用例有价值的完整解决方案。 专有创新有充足的空间 - 为特定行业提供垂直整合的包,以及基础设施和包装,使这些强大的技术足够简单,非数据科学家可以轻松采用和扩展。

相关文章

网友评论

    本文标题:机器学习为什么要开源?如何选择学习框架?

    本文链接:https://www.haomeiwen.com/subject/smhehqtx.html