laion/summarization_dataset_v2

Text Classification

4.8k downloads this month

📄 Dataset Card

Este dataset contiene filas anotadas para tareas de procesamiento de lenguaje natural y clasificación de texto en español. Recopilado y limpiado por laion, sirve para entrenar modelos robustos de análisis de sentimiento y segmentación contextual.

📊 Dataset Overview

Licenciamit

IdiomaEspañol (es)

Tamaño total1.24 GB

🚀 Uso Básico (Python)

from datasets import load_dataset

dataset = load_dataset("laion/summarization_dataset_v2")
print(dataset['train'][0])

Dataset Details

Total Rows120,530

Splitstrain, test

FormatParquet