Pandas Python Regex:错误:无需重复


问题内容

我有一个带有几个奇怪字符“ *”和“-”的数据框。

import pandas as pd
import numpy as np

data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012],
        'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions',     'Lions', 'Lions'],
        'wins': [11, '*', 10, '-', 11, 6, 10, 4],
        'losses': [5, 8, 6, 1, 5, 10, 6, 12]}
football = pd.DataFrame(data, columns=['year', 'team', 'wins', 'losses'])

我想用‘0.00’替换奇怪的字符,但出现错误-

error: nothing to repeat

我了解这与正则表达式有关,但我仍然不知道如何解决该问题。

我用来替换字符的代码:

football.replace(['*','-'], ['0.00','0.00'], regex=True).astype(np.float64)

问题答案:

* 是正则表达式中的特殊字符,您必须对其进行转义:

football.replace(['\*','-'], ['0.00','0.00'], regex=True).astype(np.float64)

或使用字符类:

football.replace([*-], '0.00', regex=True).astype(np.float64)