关于

数据

的集合

10

14-12

摘要:麻省理工学院的一个三人研究团队已经开发出一种机器学习模型,他们通过帮助我们更好地理解发现模式,从而让人类更好地理解大数据。它的创造者称之为Bayesian Case Model。这项研究是基于这样的思考:人类往往会倾向于根据自己的经验和看到的例子去思考并做出决定。例如,儿童也许能从他父母谈话的几个单词就知道他...

01

14-12

摘要:很多开发者都错误地以为移动领域是很少受到攻击的,正是这种虚假的安全感导致一些开发者在防范措施上进行节省,而后遭受的可能是很大的损失。关于如何保护应用免受攻击,作者以自身经验分享了五个应该注意的事项。Apple CEO Tim Cook在今年六月的全球开发者大会上提到过,Apple公司已有900万注册开发者,相比...

24

14-11

摘要:自基于HTML5的WYSIWYG网页制作平台推出后,用户在Nifty上建立的网站已超过5400万个,平均每天需支撑7亿的HTTP请求,然而如果聚焦某个具体的网站,其PV甚至不超过100,那么Nifty又使用了什么策略解决这些长尾问题?【编者按】Nifty运营网站已经有很长一段时间,而在基于HTML5的WYSIWYG网...

13

14-11

摘要:Linkedin周二宣布开源其大数据计算引擎Cubert,据悉,这个开源框架将让工程师使用一套专门的算法,在不浪费CPU资源的情况下,更轻松的运行查询,该公司还为此开发出新的语言Cubert Script。【编者按】Linkedin周二宣布开源其大数据计算引擎Cubert,其名字来源于鲁比克方块(Rubik’s Cube),为了让开发人...

10

14-11

摘要:在百度多年部署使用SSD的过程中,积累了很多经验,也发现了传统SSD的一些缺陷。本文作者认为,非常有必要按照大规模存储系统的需求重新设计SSD的软硬件架构,以彻底解决其不足,于是提出了“软件定义Flash”概念。百度是国内早大规模使用SSD/Flash的互联网公司之一,早在2007年,就开始在搜索引擎中大规...

07

14-11

摘要:ThriveStreams公司发布了一款App,该程序能收集比如抑郁症和双相情绪障碍的患者诊治过程中的数据,通过这款应用,用户可以分析自己情绪的趋势,规划好自己的情绪。同时参与者可以获得实质性的一些奖品。自从计算机顾问Adrian Cunanan在2002年被诊断出有双相情感障碍之后,他开始努力学习通过药物、冥想、锻炼和...

01

14-11

摘要:对于Google基础设施来说,任何时刻都可能有大量应用程序进驻。同时,随着数据量的增加,检索的难度也是愈来愈高。着眼Google Analytics,他们又是如何增加速度并减少运维难度的呢?【编者按】Google Analytics存储了全球范围内网站的大量静态数据,随着数据体积越来越大,检索的难度也必然随之增加。近日,Gen ...

31

14-10

摘要:从IOE时代,到Hadoop与飞天并行,再到飞天单集群5000节点的实现,阿里一直摸索在技术衍变的前沿。这里,我们将从架构、性能、运维等多个方面深入了解阿里基础设施。【导读】互联网的普及,智能终端的增加,大数据时代悄然而至。在这个数据为王的时代,数十倍、数百倍的数据给各个机构带来了无尽的机遇;然而,无可...

29

14-10

区别于传统环境,鉴于云环境中众多不可预测的因素和异常,其时间序列breakout检测并不容易。近日,Twitter开源了一款基于E-Divisive with Medians(EDM)的breakout检测工具,旨在更好地分析复杂环境中的时间序列数据。以下为译文当下,大数据已经深入影响到各个领域,其中包括新产品决策制定、用户参与程度衡量、...

18

14-09

摘要:短短两年,Apache Drill当下已获得超过40个公司的支持和贡献,而在近日,更被MapR加入其公司的大数据平台,作为开发者预览版展示给用户。【编者按】近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,...

回到顶部
嘿,我来帮您!