什么是大数据概念?

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,如购物网站的消费记录,这些数据只有进行处理整合才有意义。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

扩展资料:

大数据的价值

1、对大量消费者提供产品或服务的企业可以利用大数据进行精准营销。如通过电商上的消费记录精准进行产品推介,通过搜索引擎上的搜索记录进行信息推介并发送广告;

2、做小而美模式的中小微企业可以利用大数据做服务转型,如通过服务网站的搜索记录看新兴市场需求;

3、面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据

对大数据的全方位解读

大数据是当下非常火爆的一个词,人人都在谈论大数据。但大数据的定义是什么?它到底是如何出现的?它有什么特别之处?它最大的应用领域在哪里?它的发展方向是什么?对于以上问题,其实大多数人是弄不清楚的。

1)大数据时代出现的必然性

大数据和云计算这两个词经常被同时提到,很多人误以为大数据和云计算是同时诞生的、具有强绑定关系。其实这两者之间既有关联性,也有区别。云计算指的是一种以互联网方式来提供服务的计算模式,而大数据指的是基于多源异构、跨域关联的海量数据分析所产生的决策流程、商业模式、科学范式、生活方式和关联形态上的颠覆性变化的总和。大数据处理会利用到云计算领域的很多技术,但大数据并非完全依赖于云计算;反过来,云计算之上也并非只有大数据这一种应用。

云计算的起源可以追溯到 2003 年末 Amazon 公司工程师 Chris Pinkham 提交给 CEO Jeff Bezos 的一篇论文中的一个设想:将 Amazon 内部使用的计算基础设施开放给全世界的开发者。次年 11 月,Amazon 发布了第一版云计算服务:Simple Queue Service。Simple Queue Service 再往后发展至 2006 年,演变成立今天着名的 AWS(Amazon Web Sercice)。同在 2006 年,Google 公司 CEO Eric Schmidt 首次公开提出了“云计算”(Cloud Computing)的这一概念,云计算也在这一年开始变得广为人知。

大数据这个词的流行却晚了好几年——直到 2009 年,大数据这个说法才逐渐开始在互联网圈内传播。但仅仅在互联网领域流行,仍然不足以引起普遍关注,因为纯互联网经济毕竟只占全球经济总量的很小一部分。而大数据概念真正变得火爆,却是因为美国奥巴马政府在 2012 年高调宣布了其“大数据研究和开发计划”——美国政府希望利用大数据解决一些政府部门面临的非常重要的问题,该计划由横跨 6 个政府部门的 84 个子课题组成。这标志着大数据真正开始进入主流的传统线下经济。

大数据出现的时间点自有它深刻的原因。2009 年至 2012 年这段时间正是电子商务在包括中国在内的全球全面开花的几年。众所周知,互联网领域有 3 大类商业模式:广告、游戏和电子商务。而电子商务又是第 1个真正将纯互联网经济与传统经济嫁接在一起诞生的混合模式。准确地说,正是互联网与传统经济的碰撞,才真正催生出了今天几乎全民关注的“大数据”。大数据横跨了互联网产业与传统产业,而且大数据真正广阔的应用领域其实也正是比纯互联网经济大得多的传统产业。

从数据量的角度来看,在电子商务模式出现以前,传统企业的数量增长缓慢。传统企业的数据仓库中的数据大多数来自于交易型数据,而交易这种行为处于用户消费决策漏斗的最底部,这就决定了交易前的各种浏览、搜索、比较等用户行为数据的都量远远超过交易数据。电子商务模式使得企业可以采集到用户的浏览、搜索、比较等行为,这就导致企业的数据规至少提升了一个数量级。现在日益流行的移动互联网以及将来会流行的物联网又必将使数据量提高两三个数量级。从这个角度来讲,大数据时代是必然会出现的。

从IT产业的发展来看,第一代IT巨头大多是 2B 的,比如 IBM、Microsoft、Oracle、SAP 这类传统IT企业;第二代IT巨头大多是 2C 的,比如 Yahoo、Google、Amazon、Facebook 这类互联网企业。一个有意思的现象是:大数据时代前,这两类公司彼此之间基本是井水不犯河水,我们很少看见这两类公司的老板们在一起坐而论道;但在当前这个大数据时代,这两类公司已经开始直接竞争。比如 Amazon 已经开始提供云模式的数据仓库服务,直接抢占 IBM、Oracle 的市场。这个现象出现的本质原因是:在互联网巨头的带动下,传统IT巨头的客户普遍开始从事电子商务业务,正是由于客户进入了互联网,所以传统IT巨头们不情愿地被拖入了互联网领域。如果他们不进入互联网,他们业务必将萎缩。所以第三代IT巨头可能会是 2B 与 2C 融合的IT公司。

2)大数据的核心内涵

大数据概念虽然非常火爆,但少有人真正理解大数据的核心内容。一个普遍而且严重的误解就是:大数据= 数据大,即大数据就是量大的数据。事实上,除了数据量大这个字面意义,大数据还有两个更重要的特征:

1) 跨领域数据的交叉融合。相同领域数据量的增加是加法效应,不同领域数据的融合是乘法效应

2) 数据的流动。数据必须流动,流动产生价值

对于第 1) 点,百分点推荐系统研究中心实验结果显示:百分点公司有 3 家客户,分别是从事服装、化妆品和箱包销售的电商,百分点向这 3 家客户提供个性化商品推荐服务,即:百分点挖掘用户的偏好,不同的用户上同一家电商网站时,向他们展现不同的服装、化妆品或箱包,从而提高电商的转化率和客单价。我们做过两种测试:

a) 将每家网站的数据隔离。当每家网站自身的数据量增加到以前的 4 倍时,推荐效果大约能提高 5%;

b) 将三家网站的数据在去除敏感信息之后进行某种融合。融合后的数据大致是与单家网站的数据的 3 倍,比第一种情况数据量还少。但利用融合后的数据进行数据挖掘时,推荐效果能提升 30%,而且推荐商品并未发生变化,仍然是:用户上服饰类网站时只看见服装、上化妆品网站时只看见化妆品、上箱包网站时只看见箱包。

解释得详细一点,上述实验说明:对同一个消费者,如果我们要向其推荐服装。第一种方法是我们根据他过去的 4 次购买服装的行为来预测其下一次可能会购买的服饰;第二种方法是我们根据他过去分别购买服装、化妆品和箱包的各 1 次行为来预测其下一次可能会购买的服饰。两种方法的基于的用户行数分别是 4 次和 3 次,但第二种方法的效果明显更好。

对于第 2) 点,其实 10 多年前传统企业开始做数据仓库时,数据仓库从业者经常强调一个观点:企业级数据仓库的目标是让不同部门的数据流动起来,各个部门数据割裂,数据的价值就得不到发挥。到了今天的互联网时代,我们发现即使企业已经打通了内部各个部门之间的数据,但与整个互联网比起来,数据量仍然微乎其微,数据应该以互联网为媒介在企业之间某种形式的流动。参照“企业级数据仓库”的概念,现在已经开始出现了“互联网数据仓库”的概念:就是企业通过互联网渠道将与自己相关的外部数据与内部数据进行整合,从而形成“互联网数据仓库”。百分点已经在零售与媒体领域比较成功地打造了“开放数据联盟”,该联盟的成员可以在公允、安全的情况下基于该联盟建立起自己的“互联网数据仓库”,从而享用海量数据的价值。

3)大数据的应用领域

大数据的起源要归功于互联网与电子商务,但大数据最大的应用前景却在传统产业。一是因为几乎所有传统产业都在互联网化,二是因为传统产业仍然占据了国家 GDP 的绝大部分份额。

哪些传统企业最需要大数据服务呢?至少有 3 类企业:

1) 对大量消费者提供产品或服务的企业

2) 做小而美模式的中长尾企业

3) 面临互联网压力之下必须转型的传统企业

第 1) 类企业都需要利用大数据精准分析不同消费者的偏好,提高营销和服务的质量;第 1) 类企业都需要利用大数据分析精准定位自己的客户群;第 3) 类企业主要指哪些正在遭受来自互联网的新玩家冲击的传统企业,此类企业自然都需要利用互联网和大数据作为自我进化的工具。当然,第 3) 类企业与前 2 类企业有重叠。

具体来讲,中国最需要大数据服务的行业就是受互联网冲击最大的产业,首先是线下零售业,其次是金融业。

受电商的冲击,国内很多零售巨头都增长严重放缓,甚至遭遇负增长,线下零售已经到了不得不变革的危机关头。我们也看到了银泰百货、王府井百货、万达集团这些具有创新意识的传统巨头开始利用互联网和大数据来改造线下商业。其中银泰百货以手机为载体、利用 O2O 方式进行双线数据挖掘的创新非常值得借鉴。

而金融行业就更加特殊:金融业并不销售任何实体商品,它自诞生起就是基于数据的产业。由于国家管制,金融业在前几年享受了非常好的政策红利,内部变革动力不足。而目前金融业已经逐渐开始放松管制,新兴的金融机构必将利用互联网以及大数据工具向传统金融巨头发起猛烈攻击。而传统金融机构在互联网方面的技术积累和数据积累都不足,要快速应对新进入者的挑战,必然需要大数据服务。我们也看到了中信银行信用卡中心、招商银行信用卡中心已经在开始利用互联网大数据进行创新。

那么传统产业需要什么样的大数据服务呢?这主要包括 3 层:

1) 基于大数据的行业垂直应用。每个行业都有自己的特点,所以自然会存在行业应用的需求;

2) 顾客标签与商品标签的整理。不管什么行业,都需要精细化整理自己顾客的属性标签以及商品属性标签,而且这些标签必须能够细化到单个顾客和单个商品。标签是行业应用的基础;

3) 企业内部和外部数据的整合与管理。要给顾客和商品打标签,首先必须整合企业内部和外部数据,尤其是日益重要和庞大的外部数据。

图:传统企业需要的大数据服务

第 3 层和第 2 层的方法相对比较通用,行业特殊性相对较少。百分点已经在第 3 层和第 2 层做出了比较成熟的产品,并且也开始在第 1 层做出了一些具体的行业应用产品,比如针对服饰行业的时尚服饰搭配系统。

4)大数据的发展方向

大数据产业未来会向什么方向发展?随着数据逐渐成为企业的一种资产,数据产业会向传统企业的供应链模式发展,最终形成“数据供应链”。拿钢铁产业来讲,铁矿石公司从矿场中挖出矿石,经过粗加工,卖给钢铁企业;钢铁企业再进行精细一点的加工,将板材、钢条卖给下游制造业公司;这些制造业公司做出汽车、飞机、门窗、电脑等产品卖给下游公司。这个产业链中存在找矿、运输、加工等诸多环节,每个环节都有对应的企业。

图:传统企业的供应链

在“数据供应链”中,存在数据、数据整合与挖掘工具以及数据应用这 3 大环节。数据就好比矿场的矿石;数据整合与挖掘工具就好比钢厂的冶炼炉;而精准营销、服饰搭配等数据应用就好比汽车、电脑等可以出售给消费者的产品。企业在数据供应、数据整合与挖掘、数据应用等所有环节都需要专业的服务。这里尤其有两个明显的现象:

1) 外部数据的重要性日益超过内部数据。在互联互通的互联网时代,单一企业的内部数据与整个互联网数据比较起来只是沧海一粟;

2) 能提供包括数据供应、数据整合与加工、数据应用等多环节服务的公司会有明显的综合竞争优势。

5) 什么样的大数据企业会胜出

常有大数据从业者以及投资人和我们探讨一个问题:大数据产业中,什么样的企业会最终胜出?这是一个很难回答的问题,而且即使回答了,三五年内可能都无法判断其正确性。但从“数据供应链”中的各个环节来分析,还是可以得出一些具有参考价值的结论。

1) 数据供应。在互联网没有流行的时代,企业做数据仓库、商业智能、数据挖掘等系统时采用的数据基本都来自于企业内部,企业几乎无法获取外部数据,所以很少有专业的数据供应商。互联网改变了这一局面,将来会有专业的数据供应商。但既然是因为互联网的出现导致了数据供应商的出现,那么反过来数据供应商就必须具有很强的互联网基因;

2) 数据整合与挖掘。数据挖掘工具供应商在非互联网时代就早已存在。但互联网时代使得企业的数据量激增、数据类型发生极大变化(不同于传统的来自于单一领域的结构化数据,互联网数据以跨域的非结构化数据为主),传统的数据挖掘工具供应商的技术和方法已经很难适应。要跟上时代的变化,数据挖掘技术与工具应用商必须具备互联网公司的海量数据处理和挖掘的能力;

3) 数据应用。具体的行业应用与传统行业的业务关系密切,要做好行业应用,最好需要有服务传统行业的经验,了解传统行业的内部运作模式。这时候仅仅具有 2C 经验的互联网基因的公司又稍显不足。

综合起来看,如果一家大数据从业公司同时兼备互联网数据获取能力、互联网技术、互联网执行力,又有做 2B 服务的经验,那么这家公司将比较容易取得领先优势。这个结论其实一点也不奇怪:如本文开篇所述,大数据本来就是互联网与传统产业碰撞时的产物。

用“方兴未艾”这个词来形容大数据产业的发展阶段都还为时过早,目前的大数据产业只能说是小荷才露尖尖角。国内企业在第 1 代IT产业(硬件和软件产业)中是明显落后国外企业的;在第 2 代IT产业(互联网产业)中,国内企业已经与国外企业差距不大甚至在很多方面超过了国外企业;希望在第 3 代IT产业(云计算和大数据)浪潮中,国内企业能够完全赶上并且超过国外企业,我们也认为这是很有可能的。

本文来自作者[佐恋]投稿,不代表木木号立场,如若转载,请注明出处:https://www.gmx3.cn/ef/%E4%BB%80%E4%B9%88%E6%98%AF%E5%A4%A7%E6%95%B0%E6%8D%AE%E6%A6%82%E5%BF%B5%EF%BC%9F.html

(6)

文章推荐

  • 头发干燥,一向用保湿的产品洗也没用,怎么样才能使头发不干燥呀

    根据调查报告显示,很多女孩子抱怨最多的是由于头发太过柔软或是太粗硬,不好打理,占到了总数(2835人参加了此项调查)的18.9%,而紧跟其后的便是说头发卷曲不好打理,这一项占了13.3%。既然如此,那么我们就应该寻求帮助,而能帮到我们的,就是那些专业人士,比如说美发师。他们有数不清的经验可以与我们

    2025年09月14日
    19
  • 什么护肤品收缩毛孔效果比较好?

    1、迪蕾玻尿酸保湿补水面膜25ml*5¥60迪蕾是瑞士引进的护肤品牌。这款蚕丝面膜服帖性很好。核心成分六胜肽,是非常昂贵的植物美白成分,另外有多种高级成分如酵母提取物,以及松茸提取物。结合蚕丝能提升细胞的自我修复能力。产生多重功效:平衡油脂分泌,促进胶原纤维和弹力纤维再生,有效抚平细纹,美白去暗

    2025年09月15日
    19
  • “take”和“buy”分别在什么情况下使用?

    take意思:拿,带,花费buy意思:买。takesthwithsb拿着某物、带着某物;takesbtosp把某人带到某地;buysbsth=buysthtosb给某人买某物take和buy都是及物动词,后面可以直接加名词;I'mgoingtobuyabiket

    2025年09月20日
    18
  • 玉葫芦带在哪个手上最好

    《礼记》中所说:“君子无故玉不去身。”在中国几千年的历史文化中,对玉的爱好,是中华民族文化特色之一。玉有着丰富的精神内容,它象征着高贵、纯洁、友谊、吉祥等,是民间广泛流传的信物,中国人佩玉以求避邪除凶,人们以玉为美为荣为贵,玉成为人们习俗生活的一部分。玉器经过数千年的继承和发展,从史前的古朴、雅拙

    2025年10月03日
    8
  • 后有哪些系列-

    whoo后有几个系列10个系列:1拱辰享基础系列(**)2津津享基础系列(暗红色)3天气丹基础综合系列(透明金边)4补水系列拱辰享(浅粉色)5美白系列拱辰享雪(白色)6彩妆系列拱辰享(黄金色)7男士系列拱辰享君(蓝色)8针对皮肤问题特别护理系列:名义享9还幼系列10密贴系列

    2025年10月05日
    11
  • 阿玛尼滴管粉底液怎么样?

    阿玛尼是著名的国际大牌,阿玛尼的彩妆一直被很多人关注,经常听到身边的妹子在讨论阿玛尼的口红和粉底液,其实还是有很多人对阿玛尼的彩妆不是很了解,阿玛尼滴管粉底液是很多女性都非常喜欢的,那阿玛尼滴管粉底液怎么样?阿玛尼滴管粉底液好用吗?1、阿玛尼滴管粉底液(1)外观滴管粉底液,混合了粉底和精华油,静置会

    2025年10月06日
    8
  • 高中语文的文言文<<察今>>谁有原文和翻译啊-

    《察今》原文上胡不法先王之法?非不贤也,为其不可得而法。先王之法,经乎上世而来者也,人或益之,人或损之,胡可得而法?虽人弗捐益,犹若不可得而法。译文国君为什么不取法古代帝王的法今制度呢?不是它不好,而是因为后人无从取法它。先王的法今制度,是经历了漫长的古代流传下来的,人们有的增补它,有的删减它,怎么

    2025年10月10日
    7
  • 过年的习俗有哪些

    1、过年的习俗有:扫尘、办年货、团圆饭、守岁、压岁钱、贴春联、放鞭炮、拜年等。2、过年不是一天,除了除夕夜,还包括年前的准备。比如腊月二十四就要扫尘,就是对家里进行大扫除。“尘”与“陈”谐音,扫尘就是把旧的东西都清理了,晦气扫出门,迎接新年新气象。3、腊月二十六左右就要置办年货,这可是个大工程,基本

    2025年10月10日
    7
  • 333回访是什么意思

    333回访,指的是333服务模式的电话回访话术,是与顾客进行着短期、中期、长期的跟踪交流与沟通。333分别为三天、三周、三个月,对应短期、中期、长期。1、第一个3:顾客买走产品后的第三天要做电话回访。回访目的:了解顾客所购买商品质量、使用情况、对我们的工作有什么意见及建议。并询问商品的洗涤及保养情况

    2025年10月10日
    7
  • 以身边的某一个人为研究对象,分析其个性特征,思考如何根据其个性激发其旅游动

    激发旅游者的动机需要:开发特色旅游产品和服务内容。有特色才会有吸引力,要激发了旅游者的动机,就需要有特色产品来吸引大家,并且产生一种感觉,让他们爱上旅游。激发旅游者的动机需要:加强旅游企业的管理工作,帮助规范他们的业务、服务、团队等,这样可以更好地服务旅游者,塑造他们对于旅游的感觉和喜欢。对于旅游者

    2025年10月11日
    8

发表回复

本站作者后才能评论

评论列表(4条)

  • 佐恋
    佐恋 2025年10月13日

    我是木木号的签约作者“佐恋”!

  • 佐恋
    佐恋 2025年10月13日

    希望本篇文章《什么是大数据概念?》能对你有所帮助!

  • 佐恋
    佐恋 2025年10月13日

    本站[木木号]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享

  • 佐恋
    佐恋 2025年10月13日

    本文概览:大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和...

    联系我们

    邮件:木木号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们