skiprows parameter returns error in read_pandas #84

akcssb · 2023-11-02T16:53:36Z

pandas read_parquet() function has an optional parameter skiprows. read_pandas() does not accept this as a parameter, returning the following error:

TypeError Traceback (most recent call last)
Cell In[9], line 1
----> 1 dp.read_pandas(filstier[2], skiprows=5)

File ~/stat-ofi-skatteregnskap/.venv/lib/python3.10/site-packages/dapla/pandas.py:37, in read_pandas(gcs_path, file_format, columns, **kwargs)
30 gcs_path = FileClient._remove_gcs_uri_prefix(gcs_path)
32 parquet_ds = pq.ParquetDataset(
33 gcs_path,
34 filesystem=fs,
35 use_legacy_dataset=False,
36 )
---> 37 return parquet_ds.read_pandas(columns=columns).to_pandas(
38 split_blocks=False, self_destruct=True, **kwargs
39 )
40 elif file_format == "json":
41 return read_json(gcs_path, storage_options=get_storage_options(), **kwargs)

File ~/stat-ofi-skatteregnskap/.venv/lib/python3.10/site-packages/pyarrow/array.pxi:687, in pyarrow.lib._PandasConvertible.to_pandas()

TypeError: to_pandas() got an unexpected keyword argument 'skiprows'

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

skiprows parameter returns error in read_pandas #84

skiprows parameter returns error in read_pandas #84

akcssb commented Nov 2, 2023

skiprows parameter returns error in read_pandas #84

skiprows parameter returns error in read_pandas #84

Comments

akcssb commented Nov 2, 2023