Path: blob/main/docs/source/src/python/user-guide/io/hugging-face.py
7890 views
# --8<-- [start:setup]1import polars as pl23# --8<-- [end:setup]45# --8<-- [start:scan_iris_csv]6print(pl.scan_csv("hf://datasets/nameexhaustion/polars-docs/iris.csv").collect())7# --8<-- [end:scan_iris_csv]89# --8<-- [start:scan_iris_ndjson]10print(pl.scan_ndjson("hf://datasets/nameexhaustion/polars-docs/iris.jsonl").collect())11# --8<-- [end:scan_iris_ndjson]1213# --8<-- [start:scan_iris_repr]14print(15"""\16shape: (150, 5)17┌──────────────┬─────────────┬──────────────┬─────────────┬───────────┐18│ sepal_length ┆ sepal_width ┆ petal_length ┆ petal_width ┆ species │19│ --- ┆ --- ┆ --- ┆ --- ┆ --- │20│ f64 ┆ f64 ┆ f64 ┆ f64 ┆ str │21╞══════════════╪═════════════╪══════════════╪═════════════╪═══════════╡22│ 5.1 ┆ 3.5 ┆ 1.4 ┆ 0.2 ┆ setosa │23│ 4.9 ┆ 3.0 ┆ 1.4 ┆ 0.2 ┆ setosa │24│ 4.7 ┆ 3.2 ┆ 1.3 ┆ 0.2 ┆ setosa │25│ 4.6 ┆ 3.1 ┆ 1.5 ┆ 0.2 ┆ setosa │26│ 5.0 ┆ 3.6 ┆ 1.4 ┆ 0.2 ┆ setosa │27│ … ┆ … ┆ … ┆ … ┆ … │28│ 6.7 ┆ 3.0 ┆ 5.2 ┆ 2.3 ┆ virginica │29│ 6.3 ┆ 2.5 ┆ 5.0 ┆ 1.9 ┆ virginica │30│ 6.5 ┆ 3.0 ┆ 5.2 ┆ 2.0 ┆ virginica │31│ 6.2 ┆ 3.4 ┆ 5.4 ┆ 2.3 ┆ virginica │32│ 5.9 ┆ 3.0 ┆ 5.1 ┆ 1.8 ┆ virginica │33└──────────────┴─────────────┴──────────────┴─────────────┴───────────┘34"""35)36# --8<-- [end:scan_iris_repr]3738# --8<-- [start:scan_parquet_hive]39print(pl.scan_parquet("hf://datasets/nameexhaustion/polars-docs/hive_dates/").collect())40# --8<-- [end:scan_parquet_hive]4142# --8<-- [start:scan_parquet_hive_repr]43print(44"""\45shape: (4, 3)46┌────────────┬────────────────────────────┬─────┐47│ date1 ┆ date2 ┆ x │48│ --- ┆ --- ┆ --- │49│ date ┆ datetime[μs] ┆ i32 │50╞════════════╪════════════════════════════╪═════╡51│ 2024-01-01 ┆ 2023-01-01 00:00:00 ┆ 1 │52│ 2024-02-01 ┆ 2023-02-01 00:00:00 ┆ 2 │53│ 2024-03-01 ┆ null ┆ 3 │54│ null ┆ 2023-03-01 01:01:01.000001 ┆ 4 │55└────────────┴────────────────────────────┴─────┘56"""57)58# --8<-- [end:scan_parquet_hive_repr]5960# --8<-- [start:scan_ipc]61print(pl.scan_ipc("hf://spaces/nameexhaustion/polars-docs/orders.feather").collect())62# --8<-- [end:scan_ipc]6364# --8<-- [start:scan_ipc_repr]65print(66"""\67shape: (10, 9)68┌────────────┬───────────┬───────────────┬──────────────┬───┬─────────────────┬─────────────────┬────────────────┬─────────────────────────┐69│ o_orderkey ┆ o_custkey ┆ o_orderstatus ┆ o_totalprice ┆ … ┆ o_orderpriority ┆ o_clerk ┆ o_shippriority ┆ o_comment │70│ --- ┆ --- ┆ --- ┆ --- ┆ ┆ --- ┆ --- ┆ --- ┆ --- │71│ i64 ┆ i64 ┆ str ┆ f64 ┆ ┆ str ┆ str ┆ i64 ┆ str │72╞════════════╪═══════════╪═══════════════╪══════════════╪═══╪═════════════════╪═════════════════╪════════════════╪═════════════════════════╡73│ 1 ┆ 36901 ┆ O ┆ 173665.47 ┆ … ┆ 5-LOW ┆ Clerk#000000951 ┆ 0 ┆ nstructions sleep │74│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ furiously am… │75│ 2 ┆ 78002 ┆ O ┆ 46929.18 ┆ … ┆ 1-URGENT ┆ Clerk#000000880 ┆ 0 ┆ foxes. pending accounts │76│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ at th… │77│ 3 ┆ 123314 ┆ F ┆ 193846.25 ┆ … ┆ 5-LOW ┆ Clerk#000000955 ┆ 0 ┆ sly final accounts │78│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ boost. care… │79│ 4 ┆ 136777 ┆ O ┆ 32151.78 ┆ … ┆ 5-LOW ┆ Clerk#000000124 ┆ 0 ┆ sits. slyly regular │80│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ warthogs c… │81│ 5 ┆ 44485 ┆ F ┆ 144659.2 ┆ … ┆ 5-LOW ┆ Clerk#000000925 ┆ 0 ┆ quickly. bold deposits │82│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ sleep s… │83│ 6 ┆ 55624 ┆ F ┆ 58749.59 ┆ … ┆ 4-NOT SPECIFIED ┆ Clerk#000000058 ┆ 0 ┆ ggle. special, final │84│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ requests … │85│ 7 ┆ 39136 ┆ O ┆ 252004.18 ┆ … ┆ 2-HIGH ┆ Clerk#000000470 ┆ 0 ┆ ly special requests │86│ 32 ┆ 130057 ┆ O ┆ 208660.75 ┆ … ┆ 2-HIGH ┆ Clerk#000000616 ┆ 0 ┆ ise blithely bold, │87│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ regular req… │88│ 33 ┆ 66958 ┆ F ┆ 163243.98 ┆ … ┆ 3-MEDIUM ┆ Clerk#000000409 ┆ 0 ┆ uriously. furiously │89│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ final requ… │90│ 34 ┆ 61001 ┆ O ┆ 58949.67 ┆ … ┆ 3-MEDIUM ┆ Clerk#000000223 ┆ 0 ┆ ly final packages. │91│ ┆ ┆ ┆ ┆ ┆ ┆ ┆ ┆ fluffily fi… │92└────────────┴───────────┴───────────────┴──────────────┴───┴─────────────────┴─────────────────┴────────────────┴─────────────────────────┘93"""94)95# --8<-- [end:scan_ipc_repr]969798