[dataworks 技术求助贴] 如何通过 sql 语句调用 odps da ...

我看了阿里云的 dataworks 文档:
pyodps 读取 sql 类型是 pandas dataframe 是数据下载到本地，如果后续操作的都是本地的 DataFrame ，速度很慢;
而直接读取表是 odps datafrme 可以利用 maxcompute 分布式，这些接口最终都会翻译成 SQL 到 MaxCompute 计算集群做分布式计算，并且本地几乎没有任何的内存消耗，相比于单机有很大的性能提升.
我现在的问题是我要处理数据量很大（ 3000 万）需要关联多张表，并且 pyodps 中涉及参数传入 sql,这种情况下应该怎么处理？才能既可以写复杂 sql 又可以调用 odps datafrme 可以利用 maxcompute 分布式。（或者是否有其他更好的方式）
ps:pandas dataframe 和 odps dataframe 接口很多不一样，而且我看了阿里的 dataworks 和 pyodps 文档接口写的很粗糙（可能是我的问题），所以想请问是否还有其他的文档。
在这里先谢谢各位大佬了。希望有人能指点。

[dataworks 技术求助贴] 如何通过 sql 语句调用 odps datafrme，提高运行速度

浏览过的版块

热门主题

出两个双拼com已建站

vue3 史诗级更新

大家觉得什么博客值得保存下来。不限题材。

人机 Agent 团队协同：从 Managed Agents

HuiPass，一个新的一站式身份认证平台

Wolf RBAC 五年来最重要的更新： 40 刀 vib

DigVPS 测评 - SixtyNet 新增 Residential-

分享一个自用的 AI 生成文档即时预览工具—

百度最近没有大动作了，感觉死翘翘了，

搭建了一个中转站，自己用，爽的起飞了

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则