首页 江西产业资讯正文

熟悉《三体》的人,对“星环”这个词应该不陌生。《死神永生》里,载着程心离开太阳系,最终保存了地球文明的飞船,即名为“星环”。而打造这艘飞船的公司,名为“星环公司”。它聚集了全球最优秀的科学家,致力于打造最先进的太空技术。

《三体》的故事激发了多少人的科学梦,这其中就包括星环科技的创始人孙元浩。他将公司命名为“星环科技”,即希望聚集一批优秀的科研工作者,领航大数据与人工智能基础软件新纪元。

正如小说中拥有黑科技的星环公司,在大数据与AI领域,星环科技一直走在最前沿:

2017年,星环科技被IDC评为中国大数据市场领导者;

2018年,星环科技成为12年来全球首个完成TPC-DS测试并通过官方审计的数据库厂商;

2019年,星环科技登上央视九套纪录片《大数据时代》,入选中国科创企业百强;

2020年,星环科技受邀参与钟南山院士团队疫情预测项目,以知识图谱全力帮助疫情防控…

“大数据”、“AI”,一直是星环科技为外界认知的标签。但“工具层”的技术性定位,常常让大部分人对其核心业务产生困惑。

近日,亿欧有幸采访了星环科技研发总监杨一帆先生,试图探究:星环科技的“工具层”定位,究竟给市场提供了什么价值?其在AI等最前沿科技领域,又做了哪些探索?

“工具底座”打通“数据孤岛”

作为云计算三层架构之一,夹在中间的PaaS层常常是不那么耀眼的存在。

基础IaaS层,亚马逊、微软、阿里等名字早已耳熟能详,应用SaaS层,Salesforce、Workday、Adobe等美股,被市场一波又一波热捧。唯独PaaS层,因既不够“基础”,又不够贴近客户,而难以被大众认知。

但当我们细细盘点头部云厂商时,却会发现,它们不约而同地部署了自己的PaaS平台。

无论是SaaS起家的Salesforce,还是IaaS起家的亚马逊、微软,都在起势不久后,往PaaS层延伸。

本质上,软件是一门极好的生意。极少有产品能像软件那般,以极低的成本、极快的速度向市场复制。正如硅谷著名的工程师Marc Andreessen所言,软件正在吞噬世界。而其强大之根本,便在于高可用性

SaaS的标准化特性与市场的多样化需求,从根本上存在矛盾。如何以更低成本、更高效率的方式满足需求,不至于沦为“软件民工”,是困扰很多软件厂商的难题。于是,聪明的人们发明了PaaS。通俗地说,它就像乐高那些通用的积木模块,任何模型都少不了

到了大数据与AI领域,这种具备工具属性的PaaS软件,其价值更得以彰显。

星环科技研发总监杨一帆指出了这个领域的痛点问题:

“那些有心利用大数据做业务赋能的厂商,一头牵着业务应用,一头牵着海量数据,却不知道如何将它们衔接”。

“每个部门‘各自为政’,有自己的数据仓库和知识墙。若是以部门为单位采购应用软件,一是面临重复建设,二是部门各自的经验无法沉淀” 。

这便是很多企业正在面临的“数据孤岛”问题。而通用性的工具型产品,正是解决问题的钥匙。“它能够避免企业内很多1+1<2的投入”,杨一帆说道。

他详细地列举了金融领域的应用实例。

如何挖掘系统性风险,是金融厂商的经典大难题。如果把这个大课题比喻成做菜的话,它往往需要拆分成几个小步骤 :

第一步是如何处理数据原材料。这是一项“累活”,它需要我们做海量数据挖掘、提取、整合和清洗工作,为的是让数据原材料更“干净”、“易用”;

有了原材料,接下来便该着手“烹饪”了,这是决定成品好坏的重中之重。

调料包怎么配置,是各家的“独家秘方”。同理,提供什么样的建模算法,是数据厂商的“独家秘方”。正如食品企业总要宣传他们的秘方是“百年匠心制造”一样,数据厂商的核心算法,也要经过数年、数次的迭代和试错,才能提炼出那些宝贵的共性经验的“精华”。

有了它,所有在此基础上的分析、推理、决策方能水到渠成。正如那些烹饪好的菜肴,只有色香味俱全,才能供人进一步品鉴。至此,“数据”和“业务”的隔阂终被消弭。

打造了宝马车外壳,不代表就拥有了宝马。做AI数据分析工具的厂商,也不会因为有一个看似好用的工具“外壳”,就能获得市场认可。

“成就用户是第一位的”,杨一帆强调。大数据出身是星环科技得天独厚的优势,在与大量数据原材料打交道的过程中,星环磨练了先进的大数据抽取、存储与计算能力。“我们从起家起就和数据原材料打交道,一步一步方掌握了先进的领域知识”,杨一帆介绍说。

这种大数据功底,为星环科技进一步培养AI能力打造了牢固的根基。在此基础上,星环科技在AI领域建立起种种优势。

“星环是最早参与信通院知识图谱技术标准制定的一批厂商,亦是最早通过标准测试的厂商之一”,杨一帆介绍道。

而纵观市场,某些被拦在第一梯队之外的厂商,不是败在了大数据处理,就是败在了AI能力上。没有大数据处理能力只谈AI,不可避免沦为花拳绣腿;而没有AI只谈大数据处理,不可避免沦落到 “有多少人工就有多少智能”的命运。

那么,为什么星环科技能突破这两大能力障碍,跻身行业第一梯队呢?

“智子”家族打造全方位智能

《三体》中,智子(Sophon)是三体人打造的最先进武器,其威力之大,足以干扰地球科学技术发展。而星环智能的智子产品家族,便希望如智子一般,成为AI的“利器”,助力企业业务变革。

杨一帆向我们分别介绍了其Sophon Base 数据科学基础平台、Sophon KG知识图谱、Sophon Edge边缘计算平台等产品系列,它们基本覆盖了AI主流方向的各种应用场景。

相对中心化、大规模的数据处理场景,诞生了这些年大火的“风险控制”、“用户画像”、“精准营销”等业务诉求。星环科技数据科学基础平台即服务于此,它基于分布式架构,为处理大规模数据、运行复杂模型提供良好的性能支撑。

在处理单个数据中心的技术基础上,星环科技敏锐地挖掘了新的需求点,推出了酷炫的“联邦云”产品。“很多用户数据,已经不止是存放在单一数据中心上了。因此,如何联通多个数据中心,实现资源相互调用,是联邦云所要解决的难题”。

更进一步,如果多个组织由于隐私原因无法相互披露数据,但又想用到更多数据,以便建立更加准确的模型,则可用到星环科技的“联邦学习”产品,打造资源、数据、模型三者联邦。这可用于在确保隐私的前提下,打破数据孤岛,获取数据价值的前沿技术。

相对分散化、边缘化的数据处理需求,则需要边缘计算技术。

在工业监控、交通、安防等很多应用场景下,总是伴随着大量摄像头,其数据是高度分散化的。 “在人脸识别、物体检测等场景,部署在边缘端的数据传送至云端,是大部分技术已能达到的。但云端数据如何传至边缘端,却是一大难点”,杨一帆说。

“云边一体化产品的初衷,就是解决云端和边缘端双向交互的问题。这大大提高了系统灵活性,让边缘端亦变得可管理可操控。”星环科技的云边一体方案能将复杂模型运算下放至边缘计算节点,实现边缘自治。边缘端可实现离线自主判断,将高价值数据发送回云端做进一步处理;技术人员可足不出户,将云端的模型推送至千里之外的边缘设备,实现双向的智能交互。

疫情期间,星环科技的知识图谱为追寻新冠病毒的“行凶轨迹”立下了汗马功劳。利用图谱工具,患者年龄、活动轨迹、接触人群、患病治疗等信息被一网打尽,让工作人员快速、直观地明了多条重要线索,例如,哪些是需要隔离的密切接触者,哪里是需要加强防护措施的相关区域。这些都可以通过强大易用的实体关联查询、图计算等功能进行挖掘。

‘融合’是知识图谱的最难关”,在谈到知识图谱时,杨一帆如是介绍。所谓融合,即将搜集整合而来的信息,做简单筛选和处理。

举例来说,在语义上,特朗普和川普是同一个人,而苹果和苹果公司则代指不同事物,这些都需要在“融合”这一步做辨别和处理。“很多条新闻都在描述同一件事,如何将它们归齐到同一件事件里,是技术难点”。

在打磨“融合”的技术上,星环科技的独到经验,便是“研发与前端业务的高度一体化”。不同于很多还停留在单纯学术研究、论文发表的AI公司,星环科技高度重视研发和前端团队的配合,“公司内部会设置目标对齐机制,保证以业务落地为第一要务”。

不懈努力下,星环科技知识图谱已小有收获。全球软件领域最高标准的能力成熟度CMMI5级认证、服贸会示范案例等奖项,皆反映出市场对其高度认可。

在谈到星环科技的未来展望时,杨一帆提到,SAS是星环科技十分值得学习的优秀“前辈”。“他们既有深厚的理论理解、行业理解,又有强劲的技术支撑”,“例如在医疗领域,SAS有着最为详尽的文档和最强大的技术,早已是行业的实施标准。他们这种深耕行业的钻研精神,值得星环科技学习”。

定位于“工具”角色,立志于为大数据和AI铺设底层技术能力,这注定不是一条容易被理解、容易快速见效的道路。星环科技在无数次不懈地迭代、试错中,从未动摇与放弃。如今,这份坚持终于在金融、能源等领域率先开花结果。在安全可控的时代大背景下,以星环科技为首的一批AI厂商,正掀起一场数据行业的大变革。

评论