大佬们,请教一个 Python 下关于 duckdb 的数据导入很诡异的问题,困扰了我两天,不胜感激。

查看 14|回复 0
作者:llonglongago   
大佬们,请教一个 Python 下关于 duckdb 的数据导入很诡异的问题,困扰了我两天,不胜感激。
背景:
最近在搞一个小爬虫,用到了 duckdb 需要在导入的时候进行去重更新,因为导入的时候跨越数据时间久远无法在代码中就实现去重,只能通过 duckdb 的数据库机制去重
表结构如下
CREATE TABLE IF NOT EXISTS ticai (
"一级类目" TEXT,
"一级类目" TEXT,
"人数" BIGINT,
UNIQUE("一级类目", "一级类目"))
data_df 为一个 frame
columns 为列名
placeholders 为占位符个数
代码:
#拼接导入语句 INSERT OR REPLACE INTO 将现有行的每一列更新为要插入的行的新值
sql_str = f'"""INSERT OR REPLACE INTO ticai ({columns}) VALUES ({placeholders})"""'
#duckdb 执行批量导入
con.executemany(sql_str, data_df.values.tolist())
症状:
使用拼接语句执行 con.executemany ()就一直报错,结果如下
duckdb.duckdb.ParserException: Parser Error: syntax error at or near """"INSERT OR REPLACE INTO ticai (""
但是使用打印出来的 sql_str 拼接语句就能执行成功
con.executemany("""INSERT OR REPLACE INTO ticai ("一级类目", "二级类目", "人数") VALUES (?, ?, ?)""", data_df.values.tolist())
结果如下:
超级诡异,我不是很精通 Python ,也木有在其他平台找到问题的症结,球球大佬们帮忙解答下
您需要登录后才可以回帖 登录 | 立即注册

返回顶部