Testing en Inteligencia Artificial
6 entradas · filtrar en Explorar →
Conceptos (2)
Alucinaciones en LLMs
Salidas de un modelo de lenguaje que son fluidas y plausibles pero falsas o no fundamentadas en la fuente. Riesgo central de calidad en productos con IA generativa.
Testing en Inteligencia Artificial · advanced
Prompt Injection
The #1 security risk for LLM applications (OWASP LLM01): crafted input that overrides the model's intended instructions, exfiltrates data, or triggers unintended actions.
Testing en Inteligencia Artificial · advanced
Técnicas (2)
Evals de LLM (Evaluación Sistemática)
Metodología para evaluar la calidad de salidas de un LLM con datasets dorados, evaluadores (determinísticos, estadísticos, LLM-as-judge) y umbrales en CI y producción.
Testing en Inteligencia Artificial · advanced
LLM-as-Judge
Using an LLM to evaluate the quality of another model's outputs against a rubric. Scales subjective evaluation, but must be calibrated against human labels to be trustworthy.
Testing en Inteligencia Artificial · advanced