✦

Testing en Inteligencia Artificial

Conceptos (2)

Alucinaciones en LLMs

Salidas de un modelo de lenguaje que son fluidas y plausibles pero falsas o no fundamentadas en la fuente. Riesgo central de calidad en productos con IA generativa.

Testing en Inteligencia Artificial · advanced

Concepto Estándar

Prompt Injection

The #1 security risk for LLM applications (OWASP LLM01): crafted input that overrides the model's intended instructions, exfiltrates data, or triggers unintended actions.

Testing en Inteligencia Artificial · advanced

Técnicas (2)

Técnica Investigación

Evals de LLM (Evaluación Sistemática)

Metodología para evaluar la calidad de salidas de un LLM con datasets dorados, evaluadores (determinísticos, estadísticos, LLM-as-judge) y umbrales en CI y producción.

Testing en Inteligencia Artificial · advanced

Técnica Investigación

LLM-as-Judge

Using an LLM to evaluate the quality of another model's outputs against a rubric. Scales subjective evaluation, but must be calibrated against human labels to be trustworthy.

Testing en Inteligencia Artificial · advanced

Roadmaps (1)

Roadmap Investigación

Testing de un Sistema RAG antes de Producción

Ruta para validar la calidad de un sistema Retrieval-Augmented Generation: del retrieval al grounding, con evals automatizadas, red-teaming y monitoreo continuo.

Testing en Inteligencia Artificial · expert

Referencias (1)

Referencia Estándar

OWASP Top 10 for LLM Applications

Catálogo de los riesgos de seguridad más críticos en aplicaciones con LLMs: prompt injection, fuga de datos sensibles, envenenamiento, consumo excesivo y más.

Testing en Inteligencia Artificial · advanced