写在前面:当前数据存储部分数据冗余并且不遵守第三范式,我知道,但是我不改。原因是有些信息在但一表中可能不全(比如不需要详情页时),而详情页的信息我也就顺手解析了。
除非后期迫不得已,否则不做更改,估计也没人会对这点存储空间较劲吧。
新版本已经在尝试将信息汇总,初步计划是由三张表结构变成两张,分别是商铺信息和评论信息。
由于结构化数据,并且还精简了表结构,因此数据会呈现很多结构性特征。当然主要也是因为有一些参数长度不固定,没办法延展。
在这种情况下,比较方便的做法就是使用非关系型数据库来进行存储。
如果使用关系型数据库则要拆分表结构(csv同理),这会格外引入一些工作量。
因此适配关系型数据库和csv计划优先级不高。实在没什么改进的或者有人有明确需求再开发。
自行百度配置。如果你访问你主机的27017端口(默认)显示:
It looks like you are trying to access MongoDB over HTTP on the native driver port.
则代表配置成功。
你只需要在浏览器中输入127.0.0.1:27017
,通过是否立即显示上述文字来判断是否正确配置MongoDB
。
随后你需要在配置文件中更新mongo_path
为 mongodb://127.0.0.1:27017
,其中127.0.0.1
为本地回环地址,在本机配置的服务可以通过改ip访问。
更详细的信息移步百度。