大数据数据结构,指的是数据之间存在一种或多种对应关系的数据元素的组合。大数据算法,指的是一系列对用于解决方案的指令与操作的准确而完成的描述,如果将算法比作一把枪,那么大数据是子弹,大数据结构是子弹与弹壳间的火药。
2.字节跳动发展现状
(1)涉及领域广泛。涉猎范围包括新闻、短视频、美颜相机、有偿问答等多个领域,依靠抖音、今日头条抢占市场并继续推广懂车帝、激萌等系列软件以及抖音海外版——TikTok,截至2020年5月,TikTok全球下载量超19亿次,稳居苹果商店下载排行榜第一。
(2)融资情况稳定。字节跳动自2012年年初创立以来,先后接受奇虎360、红杉中国、软银等海内外资本近百亿美元融资,近期估值超1000亿美元,至2020年5月年营收1400万人民币,在未上市的情况下,字节跳动实现资金的正向流动,达到盈利水平。
(3)广泛吸纳人才。2020年4月,Hulu前副总裁NickTran出任“TikTok”北美营销主管;迪士尼前高管KevinMayer于2020年6月担任字节跳动中国首席运营官(COO)。华纳音乐集团前高管OleObermann、微软前首席知识产权顾问ErichAndersen、Goole和Facebook前首席公共政策官HelenaLersch跳槽进入字节跳动全球工作。
3.字节跳动大数据应用现状
(1)顺应移动互联网潮流,寻找互联网中的蓝海领域。继BAT(百度、阿里巴巴、腾讯)后MD(美团、滴滴)占据了互联网市场的半壁江山,国内互联网行业留给新兴企业的发展空间并不多,字节跳动通过大数据分析用户选择倾向及使用意向选择性抓住移动互联网流量的总体入口,寻找流量入口的蓝海——短视频与资讯,战略性地吸引输出用户与接受用户,收获各行业领军人物的目光,完成对软件用户人群的扩展与升级。
字节跳动站在一个新时代的风口,将大数据计算应用到内容推荐中,其核心是基于人工智能倾向选择+大数据挖掘的信息处理,战略性的存量用户把握及流量使得字节跳动在互联网战争的下半场拥有着绝对的优势。数据显示,字节跳动通过流量型广告穿插实现早期变现,爬虫各大门户网站基础讯息与资讯,依靠算法完成对内容的精准推荐,吸引流量顺序流动,及时抓住流量红利顶峰时期,加速流量流动与引流孵化,字节跳动的资讯与短视频共同推崇的“AI+大数据挖掘模式”正在重新排列国内的互联网布局,同时也刺激着其他的互联网企业加速AI的研发,例如:百度的“无人驾驶汽车”“小度音响”,阿里巴巴的“阿里云”。越来越多的互联网企业正在为我国的“智能社会”添砖加瓦。
(2)以客户为数据中心,拉动大数据发展。人工智能确定用户偏好后,将数据分类整合计算并交由数据库,使用户与后台综合内容一一对应,每个用户在数据库中相应位置对应存在用户的喜好与厌恶:每个App利用总体数据库向不同用户推荐符合偏好的广告宣传,刺激新用户下载,App记录用户在当前界面停留时间比例与方向偏好,数据库保存每一位用户的个人偏好,当用户下一次打开该App时,由App根据数据库中的相应记录向用户推荐同种类型的内容,从而改变了传统推荐的盲目现状。
把握流量用户,提升存量用户粘性,抓住第二波互联网红利时期——直播带货,短视频的流量顶峰即将到达,字节跳动已经完成对互联网下一场战争的战略部署,据不完全统计,2020年1季度仅某短视频平台带货类直播的销售额为2000亿,相比于初期的流量型广告变现,直播带货的风险大部分转嫁于带货人,平台承担风险更小,利润也更加客观,但风险的转移同时会带来新的问题,即平台需要对带货产品和直播内容进行严格把关,拒绝劣质、低俗的产品流入市场,抵制低俗直播内容充斥网络。
(3)基于用户群体,制定整体回报分析策略。在使用手机时会发现在网购App搜索过的商品会以广告的形式多次出现在字节跳动的产品中,即需求决定供应。相比于传统变现模式中广告的的无偏差性及强制性,字节跳动的广告在大数据模型下的变现更具有操作性,长时间跟踪记录用户的使用时间及形式,推荐不同内容的流量型广告,即先有求后有供,更加坚定了广告商及个人用户对平台的依赖,完成了对传统广告市场的颠覆。
整体制定的回报分析则具有执行方式弹性高、可操作性强等特点,因而字节跳动于2015年开始实现盈亏平衡,2016—2019年总体实现营收2000亿。整体回报策略在面对流量低迷情况时具有更优越的全局观和相对弹性,企业面对危机冲击时也更加游刃有余,同时整体的回报策略在构建培训发展体系方面也拥有更稳定的表现,其非定向的人才培养方式挖掘能力更加突出,相比之下,定向发展极易在培养中期产生瓶颈,从而无法达到预期的人才培养效果。
(4)数据挖掘能力、内容处理能力、实时分析能力三者共同发展。字节跳动的数据挖掘能力、内容处理能力、实时分析能力在今日头条创立初期为其发展了大量的潜在顾客。数据的挖掘能力使得字节跳动在创业初期的掌握了较多的无偏性信息,较大程度地减少了信息的不对称性对初创企业的冲击与蚕食。AI的综合使用使字节跳动在处理海量的、无序的、模糊的大型数据库内容时不再因数据繁杂出错,分类数据并构建数据之间的关联规则,构建数据关系树在优化产品功能、调整产业结构时都起到了至关重要的作用。
AI对大数据的实时分析能力使得大数据模式下的产品在应对变幻莫测的市场需求时能计时做出战术及战略的调整,在高速运算的加持下,“AI”实时分析能力已基本达到预期目的,下一步的发展前景是将实时分析模型更加贴合现实,这也是下一步大数据处理模型构建的重点。
4.大数据广泛应用带来的弊端
(1)模式化推荐内容过于单一。字节跳动的变现策略需要广告商的加持,但模式化的广告内容推荐以及重复性的内容排制,导致用户在产品使用过程中,对产品产生厌烦心理,放在兴趣层面看,即:无法真正了解用户的真实需求与目的,仅可以通过分析记录浏览方式推荐可能的兴趣内容,而不能真正的了解用户的切实需要,厌倦心理伴随每日的推荐不断积累,达到阈值时,第一批用户将面临流失,因此如何解决当下推荐算法的贴合性是同类互联网企业所面临的最大难点,也正是该难点才提高了“AI内容推荐”的行业门槛。
目前今日头条、抖音均已处在该阶段,第一批用户的流失发生在用户数量巅峰之前,因此,字节跳动在此方面仍存在调整空间。截至2020年5月抖音最高日活跃用户超4亿,且该数据还在持续增长中,发展新用户仍是目前的首要任务,待用户数量到达顶峰,保持用户粘性便会成为首要任务。
(2)个人信息安全难以保证。互联网时代的信息在一瞬间可以遍布全球,在一瞬间信息可以到达地球上每一个有网络的角落。引用电影中一句话“钱从香港去迪拜到塞浦路斯,经瑞士、伦敦、纽约,再去新西兰经日本回香港,这些钱在地球上走一圈只需要8秒”。这个时代下的个人隐私难以得到保证,字节跳动承受着网民制造的大量数据,同时也在消费数据,网络的迅速、便捷使这个世界再无秘密可言,同时个人信息安全遭受严重威胁,骚扰电话、电信诈骗正充斥着人们的生活,这与互联网时代的信息快速流动性是分不开的。字节跳动正在向门户网站转型,过程中信息爆炸的规模难以估计,信息安全是能否转型成功的关键。
数据库作为每个门户网站的私有资产,对保持门户网站运营稳定、舆论稳定都起着至关重要的作用,因此字节跳动在高速发展的同时必须严格保护用户信息的安全,避免因黑客攻击或内部人员操作失误所造成的信息泄露等重大安全问题。
(3)大数据环境下的的造假现象严重。网络销售、“标题党新闻”等现象在大量数据繁乱无序的状态下十分猖獗,为引导流量进入己方流量入口,企业伪造流量数据、新闻标题不实等现象会引起用户的潜意识抵触与防备心理,不仅加剧互联网信用困境,更加重了互联网经济发展的压力,造成互联网经济进一步发展的困局,一旦瓶颈期形成,短时间内互联网经济“症结”不会出现较大的转机。因此互联网经济的稳定发展需要进一步净化互联网数据中的虚假信息。
5.大数据未来发展方向
字节跳动作为新互联网行业中的破风者,应该保持自身差异化,持续差异化发展,革新时代产业结构维持持续性纵向发展,深入拓展未来市场,以需求侧为根本诉求,加强供给侧与需求侧的互联互动;同时丰富推荐算法,敢于突破数据束缚、打破数据壁垒,完成对互联网流量战的重新定义,冲击以BAT为代表的上一代国内互联网龙头企业,打破其霸主地位,维持中国互联网行业的健康稳定性发展;持续性探索互联网经济发展的天花板,以互联网经济为根本带动基础产业的回暖,带动加工制造业、轻工业的复苏。
6.结语
互联网是社会发展、行业进步的重要媒介,互联网的安全稳定是互联网经济与“AI”科技发展的重要基础,因此维护互联网的安全与纯净不仅仅是每个企业的任务,更是每个公民义不容辞的责任,公民是维护互联网安全的重要支柱,在支持以“AI”为主要发展方向的高新科技的同时,不应将其用于任何违反法律法规或触碰道德底线的行为。
作者:周庆轩(南京审计大学金融学院)
本文刊发于《中国高新科技》杂志2020年第21期
(转载请注明来源)