open-orca/text-generation_dataset_v3

Text Classification
4.8k downloads this month

📄 Dataset Card

Este dataset contiene filas anotadas para tareas de procesamiento de lenguaje natural y clasificación de texto en español. Recopilado y limpiado por open-orca, sirve para entrenar modelos robustos de análisis de sentimiento y segmentación contextual.

📊 Dataset Overview

Licenciamit
IdiomaEspañol (es)
Tamaño total1.24 GB

🚀 Uso Básico (Python)

from datasets import load_dataset

dataset = load_dataset("open-orca/text-generation_dataset_v3")
print(dataset['train'][0])

Dataset Details

Total Rows120,530
Splitstrain, test
FormatParquet