mdmx: (Default)
[personal profile] mdmx
В очередной раз убедился что ИИ это какая то игрушка, дал им каждому по очереди решать простую геометрическую задачку, какой я ерунды только не начитался.
--
Для улучшения качества языковых моделей (LLM) придумали RLHF, обучение на основе обратной связи от человека. В результате применения этого подхода LLM научились лучше убеждать людей в правильности ответа. При этом качество самих ответов ухудшилось, но ошибки стали более труднообнаруживаемыми.
https://arxiv.org/abs/2409.12822
--
Собственно сама задачка

Date: 2024-10-09 05:13 pm (UTC)
suhajh: (Default)
From: [personal profile] suhajh
135°K😁

Profile

mdmx: (Default)
mdmx

July 2025

S M T W T F S
  12 3 45
67 89101112
13 14151617 1819
20 21 22 2324 2526
2728 293031  

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 6th, 2025 11:02 pm
Powered by Dreamwidth Studios