
El caso de negocio para operar en premises siempre ha estado ligado al control.
Autogestionarlo, mantener los datos dentro de tu entorno y evitar el vendor lock-in. Es una intuición razonable y, durante mucho tiempo, fue una respuesta razonable.
La brecha entre lo que podías ejecutar internamente y lo que estaba disponible externamente era manejable. On-premise era una opción defendible.
La IA está cambiando eso.
El enfoque de construir y mantener todo por cuenta propia ignora casi todo lo que viene después: las personas necesarias para mantener las cosas funcionando a medida que evolucionan los modelos de IA, las tarifas de licencia y costos de computación que se agravan conforme cambia el panorama, los ciclos de actualización que nunca llegan a tiempo, y el trabajo requerido para deshacer decisiones tomadas en un contexto tecnológico que parecía distinto hace apenas seis meses.
Estos costos no están ocultos, exactamente. Simplemente son fáciles de ignorar cuando el caso inicial de negocio se centra en el costo de construcción.
Puedes ejecutar IA on-premise, pero no la mejor IA
Los modelos de frontier, los que acaparan titulares, no pueden ejecutarse en privado. Sus proveedores no los ponen disponibles para despliegue privado.
Lo que puedes licenciar y ejecutar internamente mejora constantemente, pero también lo hace la frontera. Solo que Anthropic ha lanzado más de una docena de modelos Claude en menos de dos años, y no es el único proveedor.
Self-hosting implica ciclos de lanzamiento lentos. Las actualizaciones son costosas y disruptivas, por lo que las empresas permanecen en versiones más tiempo de lo que deberían. Lo mismo ocurre con el hardware subyacente.
Las fichas de IA especializadas se quedan obsoletas con rapidez. Nuevas generaciones de GPU llegan cada pocos años, y cada una es significativamente mejor que la anterior, lo que exige una nueva inversión de capital. Tu modelo está desfasado, y el silicio sobre el que corre también, y actualizar cualquiera de ellos es un proyecto importante.
Modelos, licencias, infraestructura, herramientas, personal: todo ello no sigue un ciclo de actualización predecible. En el entorno actual, estar “fuera de fecha” puede ocurrir en cuestión de meses. Cada ronda de inversión se realiza bajo presión, con tiempo limitado para evaluar opciones adecuadamente.
La fuga de talento
Para construir y ejecutar herramientas de IA on-premise, necesitas ingenieros que no trabajan en lo que realmente diferencia a tu negocio. Mantienen la IA al día. Ajustan herramientas a medida que evolucionan los modelos. Solucionan problemas cuando algo falla. Gestionan la infraestructura. Evalúan nuevas versiones de modelos conforme salen.
En procesamiento de datos y conciliación, estas funciones son necesarias pero no generan diferenciación. Deben funcionar, pero dedicar una cantidad considerable de ingeniería a ello no te da una ventaja competitiva; es un mantenimiento costoso de algo que no es tu core business.
A medida que el entorno interno se expande y la tecnología envejece, la cantidad de personal necesario para gestionarlo crece. Son especialistas caros, y gran parte de lo que hacen no impulsa el negocio.
Por qué la IA pertenece a un mundo nativo de la nube
El argumento a favor de la IA nativa de la nube no se trata realmente de computación en la nube. Se trata de si tu arquitectura puede mantener el ritmo de una tecnología que avanza más rápido que cualquier ciclo de liberación interno puede igualar.
En un mundo nativo de la nube, las nuevas capacidades de los modelos llegan como características, no como proyectos. Cuando aparece algo mejor en la frontera, la plataforma lo absorbe. La conversación de cumplimiento no se reinicia. La revisión de seguridad no vuelve a cero. El equipo de ingeniería no tiene que reconstruir nada. La capacidad llega, y tu equipo de operaciones puede usarla el mismo día.
El argumento de control que llevó a las firmas a elegir on-premise en primer lugar sigue importando, pero ya no está en tensión con el despliegue nativo de la nube. Permisos, trazabilidad de auditoría, gobernanza, soberanía de datos: todo puede hacerse con rigor en una plataforma nativa de la nube bien diseñada, a menudo incluso con más rigor. El trade-off ha cambiado. El control ya no requiere quedarse quieto.
Las empresas que lo reconocen temprano obtienen una ventaja. Sus ingenieros se concentran en lo que realmente diferencia al negocio. Sus equipos de operaciones obtienen mejores herramientas cada trimestre sin ciclos de adquisición. La pregunta “¿estamos al día?” deja de ser una cuestión para la junta y pasa a ser un ajuste de configuración.
Qué cambia cuando trabajas con un socio de confianza
Trasladar la carga de construir, mantener, asegurar y probar a un socio especializado permite que tus recursos se enfoquen donde deben, y que tu capacidad evolucione con el mercado.
Plataformas construidas sobre infraestructuras como AWS Bedrock están diseñadas para absorber nuevas capacidades de los modelos a medida que emergen, incluyendo los modelos de frontera que no pueden self-hosted en absoluto. La arquitectura subyacente mantiene el ritmo para que las empresas que la usan no tengan que hacerlo.
Cuando surge un modelo mejor, la plataforma se adapta. Sin nuevos proyectos, sin ingenieros adicionales, sin desentrañar meses de trabajo de integración. Los equipos de operaciones se enfocan en lo que deben hacer.
Los ingenieros se concentran en lo que diferencia a la empresa. Y la pregunta de “¿estamos ejecutando el modelo correcto?” deja de ser una discusión trimestral del comité de inversiones y pasa a ser un ajuste que alguien activa.
Utiliza el mejor almacenamiento en la nube para gestionar tus datos.
Este artículo se produjo como parte de TechRadar Pro Perspectives, nuestro canal para presentar a las mentes más brillantes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si estás interesado en contribuir, descubre más aquí: https://www.techradar.com/pro/perspectives-how-to-submit
from Latest from TechRadar https://ift.tt/m7Q2CYh
via IFTTT IA