Para contratar a un data scientist, primero decide cuál de los cuatro perfiles necesitas de verdad (analítico, estadístico, orientado a ML o GenAI aplicada), redacta la oferta de empleo para ese único perfil y luego evalúa la soltura con SQL, el criterio estadístico y la capacidad de enmarcar el problema de negocio mediante una prueba práctica breve y sin filtraciones, en lugar de acertijos de programación genéricos. El error más caro es publicar antes de definir el alcance: las empresas que describen cuatro roles en una sola oferta ven cómo una búsqueda que debería cerrarse en unos 17 días se alarga más allá de los 90.

"Data scientist" es el título más sobrecargado de la industria tecnológica, y esa sobrecarga es la razón por la que tantas de estas contrataciones salen mal. Un fundador de retail, una responsable de analítica en un hospital y un VP de fintech publican la misma oferta con ese título y quieren personas completamente distintas. Esta guía es para quien sea dueño de la contratación: tanto si eres un fundador no técnico que sabe que los datos son un activo pero no distingue a un analista de un investigador de ML, como si eres un responsable de datos al que ya le tocó un "data scientist" que resultó ser un constructor de dashboards, o un manager de ingeniería al que le cayó la vacante de lado.

## ¿Qué hace realmente un data scientist y qué perfil necesitas?

Un data scientist convierte datos desordenados en decisiones o productos, pero el trabajo concreto se divide en cuatro perfiles distintos. Elegir uno antes de escribir una sola palabra de la oferta de empleo es la decisión de mayor impacto de todo el proceso. Sáltatela y cada paso posterior heredará la ambigüedad.

Los cuatro perfiles comparten una base (SQL, estadística, Python) pero premian distinta profundidad. Elige el que se ajuste al problema que de verdad intentas resolver.

| Perfil | Trabajo principal | Qué evaluar | En qué no obsesionarse |
|---------|----------|-----------|---------------------|
| DS de analítica / producto | Medir funciones, ejecutar experimentos, fundamentar decisiones | Soltura con SQL, A/B testing, sentido de producto, comunicación | Teoría profunda de ML |
| DS clásico / estadístico | Inferencia, predicción, análisis causal | Estadística desde sus fundamentos, diseño experimental | Estructuras de datos al estilo LeetCode |
| DS orientado a ML | Construir y desplegar modelos predictivos | Feature engineering, evaluación de modelos, despliegue, nociones de MLOps | Papers de investigación pura |
| Ingeniero de GenAI aplicada / AI Engineer | RAG, apps con LLM, pipelines de evaluación | Diseño de recuperación, PyTorch, disciplina de evaluación, criterio en producción | Profundidad en estadística clásica |

Un error frecuente y costoso es tratar estos perfiles como intercambiables, sobre todo confundir a un data scientist con un AI engineer o con un analista de datos. Habilidades adyacentes no son las mismas habilidades. Etiquetar mal el rol hunde la moral y la retención, porque la persona que contrataste se apuntó a un trabajo que no existe en tu empresa.

Aquí va la prueba práctica. Si la necesidad central es "dinos qué está pasando y si nuestros cambios funcionaron", quieres un perfil de analítica. Si es "predice la demanda y explica por qué", quieres el perfil estadístico. Si es "lleva un modelo al producto", quieres el orientado a ML. Si es "construye funciones con LLM", quieres GenAI aplicada. Anótalo antes de hacer cualquier otra cosa.

## ¿Es difícil contratar a un data scientist en 2026?

Sí, y la dificultad es estructural, no estacional. La demanda crece en todos los sectores mientras la cantera de talento sigue siendo escasa, y los mejores candidatos desaparecen del mercado en cuestión de días. Lo difícil rara vez es encontrar candidatos; es reconocer al adecuado lo bastante rápido.

Los números lo confirman. La Oficina de Estadísticas Laborales de EE. UU. (BLS) proyecta que el empleo de data scientist crecerá un 34 % entre 2024 y 2034, pasando de 245 900 a 328 300 puestos, lo que lo convierte en la cuarta ocupación de más rápido crecimiento de EE. UU. y la de mayor crecimiento en matemáticas y ciencias ([BLS Occupational Outlook Handbook](https://www.bls.gov/ooh/math/data-scientists.htm)). Eso equivale a unas 23 400 vacantes cada año de la década.

Esta demanda es genuinamente transversal a todos los sectores, que es el detalle que la mayoría de las guías de contratación pasa por alto. Tecnología e ingeniería es la mayor porción de la contratación global de data science, en torno al 28 %, pero eso significa que la clara mayoría de la demanda está fuera de la tecnología pura ([365 Data Science](https://365datascience.com/career-advice/data-scientist-job-market/)). Retail busca personalización y trabajo sobre comportamiento del consumidor. La biofarmacéutica está entre los empleadores que mejor pagan. Finanzas, salud y logística contratan también. Si diriges una empresa que no es de software, compites en el mismo mercado, no en un rincón más tranquilo.

La ola más amplia de contratación en IA amplifica la presión. Según datos de LinkedIn publicados por el [Foro Económico Mundial](https://www.weforum.org/stories/2026/01/ai-has-already-added-1-3-million-new-jobs-according-to-linkedin-data/) en enero de 2026, la IA ya ha añadido 1,3 millones de nuevos puestos en ingeniería, despliegue y anotación de datos. Los data scientists están al lado de ese repunte, que arrastra a los mismos candidatos hacia ofertas tecnológicas cargadas de equity. El mejor talento permanece en el mercado unos 10 días de media. Cada día que pasa de ahí inclina la cantera restante hacia candidatos más débiles, así que la rapidez es una función de tu proceso, no un lujo opcional.

## ¿Cuánto cuesta contratar a un data scientist?

El salario base mediano nacional para un data scientist es de 112 590 USD al año (BLS, mayo de 2024), pero tratar ese único número como "el salario" es la forma de que rechacen tus ofertas o de reventar el presupuesto. La horquilla es enorme y depende de la seniority, el sector, la geografía y de si entra equity en juego. Indica una banda, no un punto.

Empieza por la variación nacional. El mismo conjunto de datos de la BLS sitúa el percentil 10 cerca de los 63 650 USD y el percentil 90 cerca de los 194 410 USD. El sector también desplaza el punto medio: los servicios de I+D científica pagan una mediana de unos 120 090 USD ([BioSpace, reformulando a la BLS](https://www.biospace.com/job-trends/data-scientist-fourth-fastest-growing-u-s-job-says-bls)). Ahora suma encima la seniority y los datos de mercado:

| Banda | Base típica (2026) | Notas |
|------|---------------------|-------|
| Inicial (0-2 años) | ~95K-120K USD | Las encuestas privadas tienden a superar a la BLS |
| Senior (5-8 años) | ~160K-210K USD | La compensación total puede superar los 300K USD en las grandes tecnológicas con equity |
| Mediana del sector tech (compensación total) | ~176K USD | levels.fyi; cargada de equity, NO representativa de toda la economía |
| Base en San Francisco | ~172K USD | En torno a un 30 % por encima del nivel nacional |
| Totalmente remoto | ~159K USD | Entre el nivel nacional y las grandes áreas metropolitanas |

Los números de [levels.fyi](https://www.levels.fyi/t/data-scientist) (176K USD de compensación total) y de la BLS (112 590 USD) parecen contradecirse. No lo hacen. Miden poblaciones distintas. levels.fyi sobrerrepresenta a las tecnológicas que conceden acciones; la BLS cubre a todos los empleadores de EE. UU. en todos los sectores. Si diriges una empresa de salud o de retail, las bandas alineadas con la BLS son tu realidad, y no deberías sentir presión por igualar una oferta tecnológica de San Francisco. Si eres una startup financiada por capital riesgo que compite con las FAANG por talento de ML, los números de levels.fyi son el suelo.

Equivocarse con la banda sale caro en ambas direcciones. Anclar demasiado bajo frente a un candidato tech y lo pierdes. Anclar en la mediana tech para un rol de retail y pagas un tercio de más. Y el coste de una contratación realmente mala es mayor en datos que en la mayoría de los roles: una contratación fallida cuesta alrededor del 30 % del salario del primer año según estimaciones de SHRM y del DOL, unos 39K USD en un rol de 130K USD, pero con los datos el daño se acumula en silencio. Números equivocados se cuelan en dashboards, presentaciones al consejo y conjuntos de entrenamiento de modelos durante todo un trimestre antes de que alguien lo detecte.

## ¿Qué debe incluir la oferta de empleo de un data scientist?

Una buena oferta de empleo para un data scientist nombra un único perfil, enumera los problemas concretos de los que se hará cargo la persona contratada y declara con honestidad las herramientas y la seniority. Las vacantes vagas son la causa raíz documentada de las búsquedas de 90 días, así que la especificidad lo es todo.

Cubre estos elementos:

- **Un perfil, expresado con claridad.** "Necesitamos un data scientist de analítica que se haga cargo de la experimentación y las métricas de producto", no una lista de deseos que abarque investigación, MLOps y dashboards.
- **Problemas reales, no plantillas de responsabilidades.** "Predecir la demanda semanal en 40 tiendas" supera a "aprovechar los datos para generar insights". Los candidatos se autoseleccionan con problemas concretos.
- **El stack real.** Dialecto de SQL, Python o R, almacén de datos, nube y cualquier herramienta de ML o LLM. Esto filtra los desajustes antes de que se postulen.
- **Seniority honesta y una banda salarial explícita.** Publicar una banda reduce el ida y vuelta y señala que has definido bien el alcance del rol.
- **Cómo se ve el éxito a los 90 días.** Una breve lista de resultados les dice a los candidatos fuertes si el trabajo es real o aspiracional.

Resiste la tentación de copiar una oferta de una FAANG. Un fundador no técnico que calca una oferta de Meta acaba evaluando habilidades de analítica de producto que no sabe valorar ni necesita. Escribe para el problema que tienes delante. Para profundizar en este oficio, consulta [cómo redactar ofertas de empleo que no suenen como las de cualquier otra startup](/blog/writing-job-descriptions). La claridad del rol también acorta directamente el tiempo de cobertura, algo que tratamos en [por qué las vacantes vagas alargan tu búsqueda](/blog/role-clarity-time-to-fill-vague-requisitions).

Aquí es justo donde ayudan los pipelines preconfigurados. Las [plantillas de roles](/templates) de Kit te dan un punto de partida acotado por perfil, con las etapas, los scorecards y los espacios de evaluación ya conectados entre sí, de modo que un manager de contratación primerizo ejecuta el mismo flujo estructurado que tendría una organización de datos madura, en lugar de montarlo desde cero.

## ¿Qué habilidades y credenciales debes evaluar?

Evalúa cuatro señales transferibles que predicen el éxito en los cuatro perfiles: soltura con SQL bajo una ligera presión de tiempo, criterio estadístico en lugar de fórmulas memorizadas, capacidad para enmarcar el problema de negocio y evidencia de trabajo desplegado. Cabe destacar que no hay licencia ni certificación obligatoria para los data scientists, así que no exijas ninguna.

Las cuatro señales imprescindibles:

1. **Soltura con SQL bajo una ligera presión de tiempo.** Funciones de ventana, agregaciones, filtrado por fechas. Esta es la señal individual más predictiva de manera universal en todos los perfiles.
2. **Criterio estadístico, no fórmulas recitadas.** ¿Saben razonar sobre overfitting, sesgo de selección y validez de un test A/B, y decir qué harían cuando un resultado contradice la hipótesis? Esto último separa a quienes piensan de quienes solo aprueban exámenes.
3. **Capacidad para enmarcar el problema de negocio.** ¿Saben convertir una petición vaga de un stakeholder en una pregunta medible? Los managers de contratación señalan una y otra vez que es la habilidad más difícil de encontrar.
4. **Evidencia de trabajo desplegado.** Modelos en producción, posiciones en competiciones o un portafolio real. Para los candidatos sin un posgrado, esta evidencia es la credencial.

En cuanto a formación y credenciales, calibra tus expectativas con la realidad. La vía de acceso típica es una licenciatura en matemáticas, estadística, informática o un campo afín; muchos empleadores prefieren un máster, y un doctorado importa sobre todo para los roles de investigación ([BLS OOH](https://www.bls.gov/ooh/math/data-scientists.htm), [Research.com](https://research.com/advice/what-can-you-do-with-a-data-science-masters-degree-careers-salaries-growth)). Pero un título es un filtro, no un predictor. Candidatos con Python sólido, una intuición estadística afilada, unos cuantos proyectos desplegados y resultados en competiciones son contratados sin posgrado constantemente, sobre todo en startups y empresas medianas. Las certificaciones de nube y de proveedores complementan un portafolio; nunca lo reemplazan.

Trata cualquier credencial individual como un dato más, no como una barrera. El portafolio y la prueba práctica te dicen mucho más que una línea en un currículum.

## ¿Cómo se ejecuta una entrevista de data scientist sin filtraciones?

Una buena entrevista de data scientist sustituye los acertijos de programación genéricos por una prueba práctica breve y realista, puntuada con una rúbrica estructurada. El clásico circuito de LeetCode evalúa algoritmos de estructuras de datos que no tienen casi nada que ver con el trabajo, razón por la que tantas entrevistas de data science se describen como rotas. Evalúa el trabajo, no la trivia.

Estructura un circuito que respete el tiempo del candidato y produzca una señal comparable:

1. **Cribado (30 min).** Un ejercicio de SQL en vivo sobre datos realistas más dos o tres preguntas de razonamiento estadístico. Esta única etapa filtra la mayoría de los desajustes a bajo coste.
2. **Prueba práctica (con tiempo limitado).** Un ejercicio de código para llevar a casa o un análisis en pareja, breve y acotado, ligado a un problema parecido al tuyo. Que no pase de unas pocas horas. Los candidatos fuertes con ofertas competidoras rechazan una prueba que les devora el domingo.
3. **Conversación para enmarcar el problema de negocio.** Entrégales una petición vaga de un stakeholder y observa cómo la convierten en una pregunta medible. Es la habilidad que más necesitas y la que un acertijo no puede revelar.
4. **Encaje con el equipo y los stakeholders.** Para roles transversales, incluye a las personas a las que realmente dará servicio.

Dos reglas de diseño hacen que esto funcione o fracase. Primera: mantén la prueba práctica breve y única. Un ejercicio para llevar a casa demasiado largo te cuesta a los mejores candidatos; uno que lleva años publicado en internet evalúa memoria, no habilidad. Usa enunciados acotados y rotables y tus propios datos, en lugar de un conjunto de datos público famoso. Segunda: puntúa con una rúbrica explícita ligada a las cuatro señales, no con un "feeling" visceral. Los scorecards estructurados mejoran de forma medible la validez predictiva, como tratamos en [scorecards de entrevista estructurados](/blog/structured-interview-scorecards-predictive-validity). Para la prueba práctica en sí, [cómo estructurar ejercicios de código que los candidatos no odien](/blog/how-to-structure-code-assignments) se aplica directamente a las pruebas de analítica y ML para llevar a casa.

Y luego, muévete rápido. El mejor talento de datos desaparece en unos 10 días, así que extiende la oferta en unas 48 horas tras la ronda final. Un cierre lento e indeciso pierde a personas que ya habías convencido.

<div class="blog-inline-cta">
  <p><strong>Ejecuta un circuito riguroso sin construirlo desde cero.</strong> Los ejercicios de código de Kit están integrados con GitHub y limitados en el tiempo, puntuados con scorecards estructurados para que los revisores califiquen frente a SQL, criterio estadístico y capacidad de enmarcar el problema de negocio en vez de por intuición. La revisión del equipo y la votación mantienen la decisión honesta, y la programación de entrevistas integrada evita que un candidato de 10 días se te escape.</p>
  <p><a href="/users/sign_up">Empieza tu prueba gratuita</a></p>
</div>

## ¿Qué errores cometen las empresas al contratar data scientists?

Los fallos recurrentes son predecibles, y casi todos se remontan a saltarse el paso de definir el alcance o a precipitar el cierre. Aquí van los seis que más cuestan, y la solución para cada uno.

- **Publicar antes de definir el alcance.** Describir cuatro roles en una sola oferta de empleo es la causa raíz de las búsquedas de 90 días. Elige un perfil primero.
- **Confundir al data scientist con un AI engineer o un analista de datos.** Las habilidades adyacentes no son intercambiables. Etiquetar mal el rol hunde la retención.
- **Circuitos genéricos de LeetCode.** Evaluar algoritmos de estructuras de datos criba la cosa equivocada. Usa en su lugar una prueba práctica de SQL y estadística.
- **Pruebas para llevar a casa demasiado largas.** Los candidatos fuertes con ofertas competidoras no van a dedicar un fin de semana a tu prueba. Que no pase de unas pocas horas.
- **Ofertas lentas.** El mejor talento desaparece en unos 10 días. Decide y extiende la oferta en 48 horas tras la ronda final.
- **Indicar el salario equivocado.** Anclar en la mediana de la BLS para un rol tech, o en la mediana tech para un rol de salud, o bien pierde al candidato o bien revienta el presupuesto. Indica la banda correcta para tu sector y geografía.

Cada uno de estos es barato de arreglar una vez que lo nombras. La versión cara es dejar que los seis corran en silencio durante una búsqueda de tres meses mientras una función de predicción o de pricing se queda a medio dotar.

## Preguntas frecuentes sobre la contratación de data scientists

Respuestas breves a las preguntas que más se hacen quienes son dueños de una contratación de data scientist.

**¿Cuánto se tarda en contratar a un data scientist?**
Una búsqueda bien acotada se cierra en unos 17 días; una sin acotar que describe cuatro roles en una sola oferta puede alargarse más allá de los 90. El mayor factor de variación es si elegiste uno de los cuatro perfiles antes de publicar. La rapidez en el cierre también importa: el mejor talento permanece en el mercado unos 10 días de media, así que extiende las ofertas en las 48 horas posteriores a la ronda final.

**¿Cuánto cuesta un data scientist?**
El salario base mediano nacional de EE. UU. es de 112 590 USD al año (BLS, mayo de 2024), con el percentil 10 cerca de los 63 650 USD y el percentil 90 cerca de los 194 410 USD. La compensación total en el sector tech es mucho más alta (en torno a 176K USD según levels.fyi) porque las empresas cargadas de equity sesgan la muestra. Indica una banda ajustada a tu sector y geografía, no un único número nacional.

**¿Los data scientists necesitan una certificación o una licencia?**
No. No hay licencia ni certificación obligatoria para los data scientists. La vía típica es una licenciatura en un campo cuantitativo, con muchos empleadores que prefieren un máster y un doctorado que importa sobre todo para los roles de investigación. Las certificaciones de nube y de proveedores pueden complementar un portafolio, pero nunca reemplazan la evidencia de trabajo desplegado.

**¿Cuál es la diferencia entre un data scientist y un analista de datos o un AI engineer?**
Son perfiles adyacentes, no intercambiables. Los analistas se centran en medir qué pasó y fundamentar decisiones, los AI engineers construyen aplicaciones de LLM y ML en producción, y "data scientist" abarca cuatro perfiles intermedios. Etiquetar mal el rol es una de las principales causas de malas contrataciones y de bajas tempranas.

**¿Qué preguntas de entrevista deberías hacerle a un data scientist?**
Sáltate los acertijos genéricos de LeetCode. Plantea un ejercicio de SQL en vivo sobre datos realistas, dos o tres preguntas de razonamiento estadístico (overfitting, sesgo de selección, validez de un test A/B) y un enunciado para enmarcar el problema de negocio que les pida convertir una petición vaga de un stakeholder en una pregunta medible. Combina todo esto con una prueba práctica breve y sin filtraciones, puntuada con una rúbrica estructurada.

## Contrata data scientists más rápido con Kit

Contratar bien a un data scientist se reduce a disciplina: define uno de los cuatro perfiles, redacta una oferta de empleo para ese perfil, evalúa SQL, criterio estadístico y capacidad de enmarcar el problema de negocio mediante una prueba práctica breve y sin filtraciones, paga la banda correcta para tu sector y muévete en las 48 horas posteriores a la ronda final. Haz esas cinco cosas y convertirás un título sobrecargado y ambiguo en una contratación repetible.

Kit es un ATS nativo de IA construido para ejecutar exactamente ese circuito, para cualquier empresa que contrate talento técnico, no solo las de software. Las [plantillas de roles](/templates) convierten la decisión de "elegir uno de los cuatro perfiles" en un pipeline preconfigurado. Los ejercicios de código integrados con GitHub y los scorecards estructurados mantienen la evaluación rigurosa y ligada a señales reales. La revisión del equipo y la votación alinean a las personas que trabajarán con la persona contratada, y los asistentes de IA pueden gobernar todo el pipeline a través de la integración con MCP de Kit, para que la fricción operativa nunca frene tu cierre. Con precios por usuario, el mismo proceso de nivel FAANG resulta asequible tanto si eres una startup de cinco personas como un equipo de analítica de un hospital.

Define el rol, ejecuta el circuito y haz la oferta antes de que lo haga otro. [Empieza una prueba gratuita](/users/sign_up) y configura hoy tu primer pipeline de data scientist.