从数据到大数据,数据技术工具的演变

访客3年前黑客文章783

编辑导语:大数据近些年来是一个十分火热的话题,关于大数据的文章也是数不胜数。本文作者通过梳理本身看过的大数据相关的资料和书籍,为我们先容了从“小数据”演化为“大数据”的进程是奈何的?而且分享了一些数据技能以及东西。

从数据到大数据,数据技能东西的演变

对付大数据,叮当一直都很感乐趣,最近正亏得看数据相关的书和资料,就把这些对象梳理了一下。本文将用4张逻辑图为主线,简朴先容一个产物从“小数据”演化为“大数据”的进程,及大概用到的东西。

本文焦点逻辑:

从数据到大数据,数据技能东西的演变

一、一个简略版互联技能架构

假设我们要搭建一个小网站,在不利用成熟SaaS产物的前提下,我们的产物内里最少要有以下两个部门:

从数据到大数据,数据技能东西的演变

1. 客户端

可以是APP,小措施,甚至是一个Web网站,作为进口给我们的用户会见。

2. 处事端

处事端包罗应用处事器和数据库,应用处事器用来陈设应用端措施,处理惩罚前端请求,并举办处事响应;数据库用来存储数据,处事器通过专门与数据库交互的措施对数据库举办读写操纵(如:SQL)。

1. 我们是如何与技能系统交互的?

假设一个场景:张三打开了一个小网站,打开后呈现了登录界面,张三输入本身的账号和暗码之后点击“登录”,这时客户端会发送给处事端一个请求,查询一下数据库里有没有张三的账号信息。

假如数据库有的话张三就能登录乐成,可以利用小网站了;假如数据库没有张三的账号信息,大概就会引导张三先举办注册,注册乐成后数据库中的用户表中就会新增一条张三的信息,张三就能愉快的利用小网站了。

我们通过客户端进口与这个系统交互,我们通过操纵客户端界面,对处事端举办请求拉取处事器&数据库中的信息,给以我们反馈。

2. 处事器与数据库有什么区别?

一般我们常称为“处事器”的全称叫“应用处事器”,数据库全称叫“数据库处事器”,它们都是处事器,只是由于应用情况的差异,需要的机能差异做了区分。

数据库处事器的处理惩罚器机能要求较量高,因为其要举办频繁的操纵,内存要求大,加速数据存取速度,应用处事器相对而言要求低一些。

3. 常用数据库有哪些?

常用数据库主要有“干系型数据库”和“非干系型数据库”:

1)干系型数据库

折射现实中的实体干系,将现实中的实体干系拆分维度,通过干系模子表达出来(表及表与表之间的干系),常用的有MySQL(开源数据库)、SQL Server(微软家的)、Oracle(甲骨文家的,有完善的数据打点成果可以实现数据客栈操纵)。

2)非干系型数据库

一种相对松散且可以不按严格布局类型举办存储的数据库,一边叫NoSQL(常用的有mongoDB、 CouchDB,在MongoDB中利用键值对的 *** 暗示和存储数据,键值雷同干系型数据库表中的字段名对应的值,在MngoDB中,利用 *** ON名目标数据举办数据暗示和存储)。

二、跟着用户增长技能架构的进级

从数据到大数据,数据技能东西的演变

小网站的用户逐渐越来越多,小网站酿成了大网站,单个处事器的负载很快就到了极限,这时就需要增加多台处事器,构成处事器组,同时引入负载平衡处事器,对流量进动作态分派。

由于数据是互联网产物的焦点资产,为了担保系统数据的安详性,还需要增加数据备份处事器,多台数据库处事器同时运行,这样哪怕一个数据库出问题了,也不会影响业务正常运转。

三、数据客栈的降生

从数据到大数据,数据技能东西的演变

跟着产物用户量越来越大,市场竞争也越发剧烈,急切需要越发精确的计谋决定信息,数据库中的数据固然对付产物的运营很是有用,但由于布局巨大,数据脏乱,难以领略,缺少汗青,大局限查询等问题对贸易决定和方针拟定的浸染甚微。

在更好的发挥数据代价,1990数据客栈之父比尔·恩门(Bill Inmon)提出了“数据客栈”的观念,构建一种对汗青数据举办存储和阐明的数据系统,支撑企业的贸易阐明与计谋决定。

1. 数据客栈的实现道理是什么?

数据客栈的数据来历凡是是汗青业务数据(订单数据、商品数据、用户数据、操纵日志、行为数据……),这些数据统一汇总存储至企业数据客栈,通过对客栈里的综合数据举办有目标的阐明支撑业务决定。

2. 数据库与数据客栈有什么区别?

数据库是对及时数据举办存储和事务性处理惩罚的系统,而数据客栈则是为了阐明而设计。

3. 数据客栈与大数据客栈有什么区别?

相关文章

从 0 到 1 做短视频社区(1):初期起量阶段

从 0 到 1 做短视频社区(1):初期起量阶段

随着互联网技术的迅猛发展,短视频社区以其独特的视频交友方式,迅速获得了大众的喜爱,丰富了人们的组织文化生活。短视频社区以用户消费和用户社区为根本,致力于提升各种互动指标和关注指标。文章通过对短视频社区...

复盘:设计评审会需要注意的几点问题

复盘:设计评审会需要注意的几点问题

最近举办了一次设计方案评审,中间进程较量纠结,所以有须要复盘总结一下。 先说一下功效,我的主推方案未通过,需要凭据运营方提供的设计修改。因为运营方强调“他们是业务指标包袱者,要以他们的需求为准”。加...

如何拯救“被互联网抛弃”的一代人?

如何拯救“被互联网抛弃”的一代人?

跟着时代日新月异的成长与互联网的普及,不懂如何操纵智妙手机、利用互联网的暮年人好像正与时代潮水渐行渐远,那么作为产物司理的我们是否为这类群体设计出适宜的暮年人模式与产物呢?让我们看看笔者是如何思考的吧...

5G消息业务发布,它能避开 “高开低走”的命运吗?

5G消息业务发布,它能避开 “高开低走”的命运吗?

前几日,5G消息业务发布,并由多位重磅合作伙伴联合发布。但从众多以往经验来看,无数被大厂们寄予厚望且重磅投入的产品都在之后的运营中销声匿迹。那么5G消息能够避免这种“高开低走”的命运么? 4月8日,...

抓住“4个核心”活动运营很简单

抓住“4个核心”活动运营很简单

对电商平台来说,最常见的一个运营手段就是做勾当,通度日动实现流量转化。那么这些勾当是如何运行、如何筹谋的呢?笔者将举办阐明与解答。 最近有伴侣跟我聊起了勾当运营相关的问题,因为他看到此刻的电商平台上...

人人网再次出道,如何以怀旧之名打响社交反击战?

人人网再次出道,如何以怀旧之名打响社交反击战?

前阵子人人网归来的消息出现后,热度一直高居不下,也吸引了不少用户重新体验这款产品。不过根据笔者的体验看来,人人网的重归并没有那么用户期待的那么美好。 “瑞星”、“MSN”、“ACDSee”、“千千静...