dumbo:这个 Python 模块可以让人轻松的编写和运行 Hadoop 程序。mrjob:在 Hadoop 或 Amazon Web Services 上运行 MapReduce 任务。官网streamparse:运行针对事实数据流的 Python 代码。集成了 。官网