10
14-12
01
14-12
24
14-11
13
14-11
摘要:Linkedin周二宣布开源其大数据计算引擎Cubert,据悉,这个开源框架将让工程师使用一套专门的算法,在不浪费CPU资源的情况下,更轻松的运行查询,该公司还为此开发出新的语言Cubert Script。【编者按】Linkedin周二宣布开源其大数据计算引擎Cubert,其名字来源于鲁比克方块(Rubik’s Cube),为了让开发人...
10
14-11
摘要:在百度多年部署使用SSD的过程中,积累了很多经验,也发现了传统SSD的一些缺陷。本文作者认为,非常有必要按照大规模存储系统的需求重新设计SSD的软硬件架构,以彻底解决其不足,于是提出了“软件定义Flash”概念。百度是国内早大规模使用SSD/Flash的互联网公司之一,早在2007年,就开始在搜索引擎中大规...
07
14-11
摘要:ThriveStreams公司发布了一款App,该程序能收集比如抑郁症和双相情绪障碍的患者诊治过程中的数据,通过这款应用,用户可以分析自己情绪的趋势,规划好自己的情绪。同时参与者可以获得实质性的一些奖品。自从计算机顾问Adrian Cunanan在2002年被诊断出有双相情感障碍之后,他开始努力学习通过药物、冥想、锻炼和...
01
14-11
31
14-10
29
14-10
区别于传统环境,鉴于云环境中众多不可预测的因素和异常,其时间序列breakout检测并不容易。近日,Twitter开源了一款基于E-Divisive with Medians(EDM)的breakout检测工具,旨在更好地分析复杂环境中的时间序列数据。以下为译文当下,大数据已经深入影响到各个领域,其中包括新产品决策制定、用户参与程度衡量、...
18
14-09
摘要:短短两年,Apache Drill当下已获得超过40个公司的支持和贡献,而在近日,更被MapR加入其公司的大数据平台,作为开发者预览版展示给用户。【编者按】近日,MapR正式将Apache Drill整合进该公司的大数据处理平台,并开源了一系列大数据相关工具。时至今日,在高度竞争的Hadoop领域,开源已成为众多公司的利器,...