open-orca/text-generation_dataset_v3

Text Classification

4.8k downloads this month

📄 Dataset Card

Este dataset contiene filas anotadas para tareas de procesamiento de lenguaje natural y clasificación de texto en español. Recopilado y limpiado por open-orca, sirve para entrenar modelos robustos de análisis de sentimiento y segmentación contextual.

📊 Dataset Overview

Licenciamit

IdiomaEspañol (es)

Tamaño total1.24 GB

🚀 Uso Básico (Python)

from datasets import load_dataset

dataset = load_dataset("open-orca/text-generation_dataset_v3")
print(dataset['train'][0])

Dataset Details

Total Rows120,530

Splitstrain, test

FormatParquet