apache/hadoop 简介: Hadoop 是一个开源的分布式计算和存储框架,有助于使用许多计算机组成的网络来解决数据、计算密集型的问题。基于MapReduce计算模型,它为大数据的分布式存储与处理提供了一个软件框架。
sparkApache软件基金会@apacheApache Spark - 用于大数据处理的统一分析引擎
PythonScalaRJavabig-data Scala41.92 k1 天前kafkaApache软件基金会@apachekafka 是由领英开源的一款高吞吐、低延迟的分布式发布订阅消息系统
Scalakafka Java30.94 k3 小时前flinkApache软件基金会@apacheFlink 是一个分布式批处理和流处理框架
ScalaJavabig-dataflinkPython Java25.28 k12 小时前grok-1@xai-org大模型Grok-1开源
Python50.51 k1 年前dorisApache软件基金会@apacheDoris 是百度开源的支持对海量大数据进行快速分析的MPP数据库。
olap数据库hudiicebergreal-time Java14.3 k2 小时前tensorflow@tensorflow • 谷歌公司#计算机科学#适合所有人的开源机器学习框架
Tensorflow机器学习Python深度学习深度神经网络 C++191.69 k2 小时前reactMeta@facebook#JavaScript框架#构建用户界面的JavaScript框架
JavaScriptReact前端declarativeui JavaScript239.05 k28 分钟前elasticsearchelastic@elastic#搜索#Elasticsearch 是一个分布式、高扩展、高实时的搜索引擎与数据分析引擎
elasticsearchJava搜索引擎 Java73.83 k2 小时前zookeeperApache软件基金会@apacheZooKeeper 是一个分布式协调服务,用于注册中心、配置中心、同步服务、订阅发布
zookeeper数据库HacktoberfestJavaapache Java12.6 k8 小时前redisRedis@redis#向量搜索引擎#Redis 是一款流行的内存型数据库,数据以键值对形式存储,常用作缓存和消息队列中间件。支持的数据类型有 Strings, Lists, Sets, Sorted Sets, Hashes, Streams, HyperLogLogs, Bitmaps。
数据库key-valueNoSQLRediscaching C70.92 k1 天前hiveApache软件基金会@apacheHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能
Javahive数据库SQLapache Java5.8 k2 天前garnetMicrosoft@microsoftGarnet 是一个微软开源的高性能的缓存服务器,可兼容现有的Redis Client
cachecache-storageclusterconcurrenthash-table C#11.49 k1 天前icebergApache软件基金会@apacheIceberg 是用于庞大分析数据集的开放表格式。 Iceberg 为大数据带来了 SQL 表的可靠性和简单性,同时让 Spark、Trino、Flink、Presto、Hive 和 Impala 等引擎能够同时安全地使用相同的表。
icebergapacheHacktoberfest Java7.98 k9 小时前awesome-computer-vision@jbhuang0604计算机视觉相关资源合集
22.51 k1 年前vscodeMicrosoft@microsoft#编辑器#Visual Studio Code(简称VS Code)是微软开源的一款代码编辑器。默认支持非常多的编程语言,包括JavaScript、TypeScript、CSS和HTML,通过下载扩展也可支持Python、C/C++、Java和Go在内的其他语言。
editorElectronVisual Studio CodeTypeScriptMicrosoft TypeScript176.84 k7 小时前dubboApache软件基金会@apacheDubbo 是由阿里巴巴开源的一款高性能的 RPC 框架。
dubbodistributed-systems框架Java微服务 Java41.38 k2 小时前🇨🇳Made-With-ML@GokuMohandas#自然语言处理#学习如何设计、开发、部署、和迭代生产级机器学习应用
机器学习深度学习PyTorch自然语言处理数据科学 Jupyter Notebook43.12 k1 年前kubernetes@kubernetes • 谷歌公司kubernetes(简称K8s),是用于自动部署、扩展和管理“容器化(containerized)应用程序”的开源系统,其的目标是让部署容器化的应用简单并且高效。
KubernetesGocncfcontainers Go117.56 k11 小时前scikit-learnscikit-learn@scikit-learn#计算机科学#scikit-learn 是基于 SciPy、NumPy、matplotlib 构建的 Python 机器学习框架
机器学习Python统计数据科学数据分析 Python63.38 k20 小时前data@GoogleTrendsAn index of all open-source data
JavaScript4.73 k2 年前