大批量处理excel文件到ODPS中方案

  • 时间:
  • 浏览:1

将转储SQL文件形态学 和数据文件上传到RDS中执行,数据便到RDS中,有然后在dataworks中整库迁移数据即可完整同步完成,整个批量上传过程一下午即将五千多个excel文件完整上云。

于是就寻找别的方法,最终通过在本机电脑上自建mysql数据库,有然后用navicat连接上,通过navicat批量的上传数据到mysql 中,

备注: 该方法还还还能否实现excel文件转去掉 csv文件进行上云。有然后将会格式不统一,还还还能否逐个的创建表进行上传,一天只上传一百来个excel文件,时延是非常慢的。

通过查找发现dataworks支持RDS整库迁移的方法,于是就在想不是还还还能否将那此excel文件批量的上传到RDS中,购买了有有有有有一个RDS实例,通过半天的学习配置等,发现也无法批量的上传excel文件。

以上可是 另一方在使用中摸索的方法,相信还有更好更完善的方法,希望没没有人 多多分享。

1 、首先按照excel文件内容创建表(下图序号1中),有然后将excel文件进行解决,删除一点不会要的数据(序号2中的一点空格),有然后另存为逗号分隔的csv格式文档,有然后在dataworks数据开发中上传csv文件,达到将excel文件上传。(具体的还还还能否参照官网上步骤,非常的完整,你会不啰嗦了)。

将会考虑到在本机自建mysql毕竟不稳定,就打算购买ECS,有然后在后面 自建mysql,有然后同步数据,不过该方法最终同步成功,有然后不建议使用,该方法不支持整库迁移,有然后不还还还能否写脚本,还还还能否两台以上的ECS,其中一台作为代理,故不推荐该方法。

刚接到需求时有点痛 的懵,不过工作还是要做的,首先通过查询dataworks中文档来看为什实现该需求,通过文档了解到只支持csv、txt等格式进行单个上传,有然后就刚现在开始着手做。

最近所做的项目还还还能否将近五千个excel文件导入到ODPS,有然后excel文件内容格式完整不一样。

总的来说dataworks升级到2.0功能是十分强大的,数据保护伞、智能监控、数据服务、任务发布等新功能。