我有两只大熊猫数据帧像这样:
df1
网站 | 链接 |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteX | https://www.retailer_siteX.com |
df2
网站 | 链接 |
---|---|
retailer_site1 | https://www.retailer_site1.com |
... | ... |
retailer_siteY | https://www.retailer_siteY.com |
因此,我想通过df2和现实的联系,从df2在df1. 这是我的代号:
for row in df2['link'].astype(str):
boolean_findings = df1['link'].str.contains(row)
当我打印boolean_findings,我得到的所有错误的,我知道不可能是真的因为我看到匹配的上我的excel文件:
boolean_findings |
---|
假 |
假 |
... |
假 |
我想知道的是为什么超级链接串的文本不是正在与这相当于在第一df,并什么我可以做到相匹配的网站。
TypeError: replace() takes no keyword arguments
. 当我删除了regex=True
它不会出错了,但它并不能取代它。 我想我会看到的re
模块解决这事,但是谢谢你把我放在正确的道路上!