13. Etapas de un proyecto de Machine Learning: El problema

13. Etapas de un proyecto de Machine Learning: El problema

Author: Marta Arroyo September 8, 2022 Duration: 14:40

📝 Podéis encontrar las notas del programa completas en https://datos.ninja/podcast/13-etapas-proyecto-machine-learning-parte-1/

El episodio de hoy de Un Podcast Ninja sobre Big Data es el primero de una saga de episodios en la que hablaremos sobre el flujo de trabajo en proyectos de Machine Learning. Empezamos por una parte crucial: Entender el problema que tenemos entre manos.

⭕️ Para refrescar de qué va esto del Machine Learning tenéis el episodio 7 del podcast: ¿Qué es el Machine Learning?

Nuestro punto de partida es entender el problema que vamos a resolver.

Lo más interesante del Machine Learning es que puede aplicarse en un montón de campos. Hoy trabajas con datos de un ecommerce, mañana con imágenes de una línea de producción, no hay límites.

Al ser una disciplina tan transversal, no podemos aplicarla de la misma manera en todos los casos de uso. Tenemos que empezar por intentar comprender por qué un cliente determinado está intentando resolver el problema que nos ha presentado y qué valor va a obtener de la solución que le demos.

Hay que tener en cuenta cómo se va a utilizar el modelo de Machine Learning que obtengamos y cómo va integrarse en el negocio de nuestro cliente.

Y ojo porque en ocasiones puede que la mejor solución ni siquiera incluya Machine Learning.

Una vez que tengamos claro que aplicar Machine Learning es una opción válida tendremos que analizar el tipo de entradas que recibirá nuestro modelo y la variable objetivo que estamos intentando predecir.

Además, haremos una aproximación - aunque sea de punto gordo - del tipo de problema de Machine Learning que vamos a resolver (clasificación, regresión, sistema recomendador...).

Finalmente, tendremos que analizar el contexto en el que va a vivir nuestro modelo y las restricciones del entorno en el que se desplegará (si es que hay alguna).

¡Todo esto antes de tan siquiera recolectar ni un solo dato!

Espero que el episodio de hoy os sea de provecho y que aprendáis algo de valor.

Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.

Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.

Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.

⭕️ Enlace al episodio 9 en el que hablábamos de predecir la bolsa y vimos cómo no podíamos predecir los movimientos de un stock basándonos únicamente en sus valores pasados. 


Marta Arroyo te invita a adentrarte en el universo del Big Data e Inteligencia Artificial. Este podcast está pensado para quienes, desde su día a día aparentemente ordinario, sienten curiosidad por las tecnologías que están redefiniendo nuestro mundo y desean comprenderlas sin necesidad de un doctorado en ciencias de la computación. Cada episodio desmonta conceptos complejos en ideas accesibles, explorando no solo el cómo funcionan estas herramientas, sino también su impacto práctico, sus implicaciones éticas y su rumbo futuro. Escucharás conversaciones que van más allá de la teoría, encontrando aplicaciones reales, historias de implementación y reflexiones sobre el papel humano en un panorama cada vez más automatizado. Es un espacio para aprender, cuestionar y descubrir cómo estos campos no son solo dominio de expertos, sino habilidades que cualquiera puede comenzar a descifrar. Acompaña a Marta en este viaje de transformación digital, donde la información y la algorítmica dejan de ser un misterio para convertirse en un lenguaje familiar. Suscríbete para no perderte ningún episodio de este podcast que democratiza el conocimiento técnico.
Author: Language: es-es Episodes: 100

Big Data e Inteligencia Artificial
Podcast Episodes
68. Kaggle y el Machine Learning de competición [not-audio_url] [/not-audio_url]

Duration: 18:58
En el episodio de hoy hablamos de Kaggle, la plataforma de competiciones de Machine Learning por excelencia. - Cómo funcionan las competiciones de Kaggle - Cómo puede ayudar Kaggle en el aprendizaje de Ciencia de Datos P…
67. Los cuadernos de Jupyter [not-audio_url] [/not-audio_url]

Duration: 20:56
En el episodio de hoy hablamos de los cuadernos de Jupyter 🪐 ☕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠¡Apoya el podcast!⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ☕️ ¿Cómo funcionan los Jupyter Notebooks? ¿Para qué sirven y para qué no sirven? Y opciones para poder utilizarlos…
66. El motor de la Inteligencia Artificial [not-audio_url] [/not-audio_url]

Duration: 15:57
En el episodio de hoy vamos a hablar de GPUs. ¿Qué es una GPU y por qué son importantes para el Machine Learning? ¿En qué se diferencia una GPU de una CPU? Y todas estas cositas :) Enlaces mencionados en el episodio: ⭕️…
65. Propósitos 💫 [not-audio_url] [/not-audio_url]

Duration: 13:36
En el episodio de hoy vamos a hablar de propósitos de año nuevo para ninjas de los datos. Os propongo algunas opciones para progresar este año como analistas de datos, especialistas de machine learning o ingenieros de da…
64. Grandes éxitos de la IA (Industria y política) [Edición 2023] [not-audio_url] [/not-audio_url]

Duration: 22:43
En el episodio de hoy vamos a ver cómo ha movido el mundo la Inteligencia Artificial en estos últimos meses. Desde la aparición de ChatGPT y la IA volviéndose mainstream hay muchísimo movimiento que va más allá de lo téc…
63. Grandes éxitos de la IA [Edición 2023] [not-audio_url] [/not-audio_url]

Duration: 23:47
En el episodio de hoy vamos a hablar de todas las cosas que han pasado en el mundo de la inteligencia artificial estos últimos meses. Y sí, este año todo ha girado alrededor de los Grandes modelos del lenguaje 🚀 LLMs del…
62. Big Data, Inteligencia Artificial y drogas [not-audio_url] [/not-audio_url]

Duration: 20:02
Hoy vamos a hablar de drogas, peeero no de las que estáis pensando sino de las drogas que sirven para curar enfermedades. Vamos a hablar de cómo se utiliza el Big Data y la Inteligencia Artificial en la industria farmacé…
61. ¿Cuántas matemáticas es realmente necesario saber? [not-audio_url] [/not-audio_url]

Duration: 17:54
Los primeros cursos de los planes de estudios de ciencia de datos están plagados de matemáticas, cálculo y estadística. ¿Necesario para fundar una buena base sobre la que construir lo demás? ¿Demasiado abrumador desde el…
60. Oportunidades en Inteligencia Artificial [not-audio_url] [/not-audio_url]

Duration: 19:33
En el episodio de hoy hablamos de las oportunidades que están ahí, por descubrir, dentro del campo de la Inteligencia Artificial. Recordad que si tenéis cualquier duda, pregunta o comentario podéis contactar conmigo a tr…
59. ¿Qué es la ingeniería de características? [not-audio_url] [/not-audio_url]

Duration: 24:26
En el episodio de hoy hablamos de qué es, para qué sirve y cómo se hace la ingeniería de características. Fundamental en proyectos de Machine Learning 🥷 Recordad que si tenéis cualquier duda, pregunta o comentario podéis…