"# Creamos el directorio Tarea_1/data/shakespeare\n",
"data_dir = Path(\"data\") / \"shakespeare\"\n",
"data_dir = Path(\"data\") / \"shakespeare\"\n",
"data_dir.mkdir(parents=True, exist_ok=True)\n",
"data_dir.mkdir(parents=True, exist_ok=True)\n",
"\n",
"\n",
...
@@ -128,13 +126,13 @@
...
@@ -128,13 +126,13 @@
},
},
"outputs": [],
"outputs": [],
"source": [
"source": [
"# TODO: Actualizar con su versión de clean_text() en la Tarea_1\n",
"# TODO: Actualizar con su versión de clean_text() de la Tarea_1\n",
"\n",
"\n",
"def clean_text(df, column_name):\n",
"def clean_text(df, column_name):\n",
" # Convertir todo a minúsculas\n",
" # Convertir todo a minúsculas\n",
" result = df[column_name].str.lower()\n",
" result = df[column_name].str.lower()\n",
"\n",
"\n",
" # FIXME:\n",
" # FIXME: completar\n",
" for punc in [\"[\", \"\\n\", \",\"]:\n",
" for punc in [\"[\", \"\\n\", \",\"]:\n",
" result = result.str.replace(punc, \" \")\n",
" result = result.str.replace(punc, \" \")\n",
" return result\n",
" return result\n",
...
...
%% Cell type:markdown id: tags:
%% Cell type:markdown id: tags:
# Introducción a la Ciencia de Datos: Tarea 2
# Introducción a la Ciencia de Datos: Tarea 2
Este notebook contiene el código de base para realizar la Tarea 2 del curso. Puede copiarlo en su propio repositorio y trabajar sobre el mismo.
Este notebook contiene el código de base para realizar la Tarea 2 del curso. Puede copiarlo en su propio repositorio y trabajar sobre el mismo.
Las **instrucciones para ejecutar el notebook** están en la [página inicial del repositorio](https://gitlab.fing.edu.uy/maestria-cdaa/intro-cd/).
Las **instrucciones para ejecutar el notebook** están en la [página inicial del repositorio](https://gitlab.fing.edu.uy/maestria-cdaa/intro-cd/).
**Se espera que no sea necesario revisar el código para corregir la tarea**, ya que todos los resultados y análisis relevantes deberían estar en el **informe en formato PDF**.
**Se espera que no sea necesario revisar el código para corregir la tarea**, ya que todos los resultados y análisis relevantes deberían estar en el **informe en formato PDF**.
%% Cell type:markdown id: tags:
%% Cell type:markdown id: tags:
## Cargar dependencias
## Cargar dependencias
Para esta tarea, se han agregado algunos requerimientos, asegúrese de instalarlos (puede usar el mismo entorno virtual de la Tarea 1):
Para esta tarea, se han agregado algunos requerimientos, asegúrese de instalarlos (puede usar el mismo entorno virtual de la Tarea 1):