Мои данные имеют вид:
1 440:0,033906222568727 730:0,0424739279722748 1523:0,0773048148348295 1893:0,0433930684646909
1 271:0,0646290650479301 405:0,0653366028581683 584:0,0744087075001463 770:0,0717824200677465
1 577:0,0679078686536282 761:0,0506946081073312
-1 440: 0,0437614564467411 798: 0,0370070258333617 831: 0,0549176430011721 1 681: 0,0715035548706038 1963: 0,102891965918849 2667: 0,0461603813033019 2899: 0,0672807783934756
Я хочу вывести в виде таблицы:
1 440 0.033906222568727 ......
1 271 0.0646290650479301 ......
1 271 0.0646290650479301 ......
1 577 0.0679078686536282 .........
Я пытался использовать
x = pd.read_csv('rcv1_train.binary', sep = "\s+|:", engine = 'python')
и получил ошибку:
pandas.errors.ParserError: Ожидалось 413 полей в строке 134, увидел 419. Ошибка может быть связана с игнорированием кавычек при использовании многосимвольного разделителя.
"Я пытался использовать " - и что случилось?
Я получил ошибку: pandas.errors.ParserError: Ожидается 413 полей в строке 134, видел 419. Возможно, ошибка связана с игнорированием кавычек при использовании многосимвольного разделителя.
Возможный дубликат Обработка переменного количества столбцов с помощью Pandas — Python