<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>mwt-design - 数据与机器学习</title>
    <link>http://mawentao.com/forum.php?mod=forumdisplay&amp;fid=51</link>
    <description>Latest 20 threads of 数据与机器学习</description>
    <copyright>Copyright(C) mwt-design</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Thu, 18 Jun 2026 05:00:15 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>http://mawentao.com/static/image/common/logo_88_31.gif</url>
      <title>mwt-design</title>
      <link>http://mawentao.com/</link>
    </image>
    <item>
      <title>测试一下</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=761</link>
      <description><![CDATA[测试一下测试一下测试一下测试一下测试一下测试一下]]></description>
      <category>数据与机器学习</category>
      <author>蜗牛</author>
      <pubDate>Wed, 14 Aug 2019 07:14:28 +0000</pubDate>
    </item>
    <item>
      <title>大数据平台架构</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=652</link>
      <description><![CDATA[下图是2019年11月结合DD的数据平台思考整理大数据平台架构图。



开源大数据组件在DD的使用：

[*]Flume：Hera平台
[*]Flink：Woater平台
[*]离线计算框架整合为数据梦工厂
[*]数易：自研的可视化报表引擎
[*]提数工具：HSQL模板+定时调度
[*]数据地图：数据治理部自研 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Tue, 23 Jan 2018 03:41:59 +0000</pubDate>
    </item>
    <item>
      <title>MySQL查询中使用union的技巧和注意事项</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=635</link>
      <description><![CDATA[把一张表的一条记录（通过不同的条件约束）变成两条记录时，一般会使用union来实现。但是需要注意的是，要给拆出来的两张表第一个字段附上不重复的ID，不然就会踩到坑。]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Wed, 08 Nov 2017 09:20:22 +0000</pubDate>
    </item>
    <item>
      <title>HIVE使用注意事项及技巧</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=634</link>
      <description><![CDATA[HIVE使用中的一些小技巧和注意事项：
1、储存路径
关注HIVE表的数据存储，一般情况下，较少去关注HIVE的数据储存，但如果一旦涉及到定时任务或者调度系统，需要注意上游数据的产出路径、时间、是否产出成功，这时需要关注所使用数据的HDFS路径（使用desc extended table ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Tue, 07 Nov 2017 09:30:39 +0000</pubDate>
    </item>
    <item>
      <title>数仓设计之魂：反三范式设计</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=631</link>
      <description><![CDATA[提到数仓，一般做技术的首先会想到是大数据，ETL，Hadoop，Hive，HBase等之类的技术名词。之前一些RD问我海浪数仓是怎么设计的时候，我一般也是这么简单回答的。但是，仔细思考一下，这些只能算是数仓设计之形，而非魂之所在。只要设计得要点，MySQL，Excel，甚至文本 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Sat, 28 Oct 2017 01:27:50 +0000</pubDate>
    </item>
    <item>
      <title>数仓设计规范</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=616</link>
      <description><![CDATA[此规范源自滴滴工作期间的实践

一、数仓层级


字段规范
[*]ODS数据表中从mysql数据源中抓取的表字段名称按照原始名称存放，保持不变。
[*]ODS数据表中从public数据源中抓取的表字段只有prefix_key和param字段（map类型）。
[*]字段中涉及乘客司机订单信息，分别用pass ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Thu, 24 Aug 2017 06:44:45 +0000</pubDate>
    </item>
    <item>
      <title>Jupyter环境安装</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=614</link>
      <description><![CDATA[Jupyter是使用Python做数据分析，机器学习的IDE。可能你会奇怪，Python开发有很多IDE可以选择，为什么要使用Jupyter呢？这里需要先建立一个新的认知：写代码做数据分析跟写代码做软件系统是不同的。软件系统在运行时是一个连续的流程，一个输入对应一个输出。而数据分析 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Thu, 24 Aug 2017 02:14:27 +0000</pubDate>
    </item>
    <item>
      <title>商业智能bi、大数据、传统报表、数据分析有何区别？【转】</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=613</link>
      <description><![CDATA[大 数 据

专注于前沿大数据案例资讯


1、BI（BusinessIntelligence）即商业智能，它是一套完整的解决方案，用来将企业中现有的数据进行有效的整合，快速准确的提供报表并提出决策依据，帮助企业做出明智的业务经营决策。
标签：ETL、数据仓库、OLAP、可视化报表。
B ...]]></description>
      <category>数据与机器学习</category>
      <author>mawenta_K58jZ</author>
      <pubDate>Tue, 22 Aug 2017 00:29:11 +0000</pubDate>
    </item>
    <item>
      <title>为什么Python是最好的AI语言？【转】</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=612</link>
      <description><![CDATA[编辑｜厂白小]]></description>
      <category>数据与机器学习</category>
      <author>mawenta_K58jZ</author>
      <pubDate>Tue, 22 Aug 2017 00:27:32 +0000</pubDate>
    </item>
    <item>
      <title>数据分析：从Table到Cube</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=595</link>
      <description><![CDATA[企业的决策人员需要从不同的角度来审视业务，分析业务，以做出最优决策。对于这件事，最初我认为就是整理一些报表。但是，随着做数据的深入，我对这件事的认知有了一次升级，BI领域中的数据分析需求不是一张二维报表就能满足的，它需要的是一个多维的立方体（Cube）。

 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Fri, 30 Jun 2017 03:43:02 +0000</pubDate>
    </item>
    <item>
      <title>传统BI，敏捷BI，探索式BI，三者有什么关系和异同？【转】</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=584</link>
      <description><![CDATA[传统BI，敏捷BI，探索式BI，三者有什么关系和异同 ？

XPIVOT
SSAS &amp; Excel &amp;Cube架构师、产品经理 
www.flybi.net 商业智能BI社区专家
www.hellobi.com 商业智能BI学院 微软 SSAS 性能调优课程讲师

打个比方来说说个人偏见理解吧，传统BI就好比是蹭饭，人家给什么你就 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Tue, 09 May 2017 03:14:02 +0000</pubDate>
    </item>
    <item>
      <title>敏捷BI凭什么是大势所趋？【转】</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=583</link>
      <description><![CDATA[永洪科技销售副总裁王桐今日在接受Arch Summit的专访中谈到，敏捷、高性能和自服务这三点，是敏捷BI和传统BI最核心的区别，敏捷BI将逐渐取代传统BI。以下是采访全文。

1.大家好，我现在在ArchSummit的大会现场，今天十分高兴邀请到永洪BI合作总监王桐接受我们的采访， ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Tue, 09 May 2017 03:11:56 +0000</pubDate>
    </item>
    <item>
      <title>数据库与数据仓库的区别</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=572</link>
      <description><![CDATA[数据处理大致分为两类：
1. OLTP（On-Line Transaction Processing） ：联机事务处理，这是一种操作型处理，是传统的关系型数据库的主要应用。
2. OLAP（On-Line Analytical Processing）：联机分析处理，这是一种分析型处理，是数据仓库系统的主要应用，支持复杂的分析 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Thu, 13 Apr 2017 03:29:03 +0000</pubDate>
    </item>
    <item>
      <title>HIVE和HBASE的区别</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=571</link>
      <description><![CDATA[1. 两者分别是什么？    Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言，这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能，但是Hive不能够进行交互查询--因为它只能够在Haoop上批量的 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Tue, 11 Apr 2017 03:54:40 +0000</pubDate>
    </item>
    <item>
      <title>优化SQL查询：如何写出高性能SQL语句【转】</title>
      <link>http://mawentao.com/forum.php?mod=viewthread&amp;tid=535</link>
      <description><![CDATA[1、 首先要搞明白什么叫执行计划？


执行计划是数据库根据SQL语句和相关表的统计信息作出的一个查询方案，这个方案是由查询优化器自动分析产生的，比如一条SQL语句如果用来从一个 10万条记录的表中查1条记录，那查询优化器会选择“索引查找”方式，如果该表进行了归档 ...]]></description>
      <category>数据与机器学习</category>
      <author>admin</author>
      <pubDate>Sat, 07 Jan 2017 02:54:27 +0000</pubDate>
    </item>
  </channel>
</rss>