laion/summarization_dataset_v2
Text Classification4.8k downloads this month
📄 Dataset Card
Este dataset contiene filas anotadas para tareas de procesamiento de lenguaje natural y clasificación de texto en español. Recopilado y limpiado por laion, sirve para entrenar modelos robustos de análisis de sentimiento y segmentación contextual.
📊 Dataset Overview
Licenciamit
IdiomaEspañol (es)
Tamaño total1.24 GB
🚀 Uso Básico (Python)
from datasets import load_dataset
dataset = load_dataset("laion/summarization_dataset_v2")
print(dataset['train'][0])Dataset Details
Total Rows120,530
Splitstrain, test
FormatParquet