watermarks

Feb. 16th, 2025 03:50 pm
sab123: (Default)
[personal profile] sab123
"Can Simple Averaging Defeat Modern Watermarks?"
https://neurips.cc/virtual/2024/poster/94798

Человек нашел,что "водяные знаки" в картинках легко выцепляются усреднением большого количества картинок, и потом вырезаются вычитанием этого среднего. Говорит, что еще они очень чувствительны к позиции, даже тупо отрезав с одной тстороны один-два пикселя, многие водяные знаки перестают распознаваться.

С другой стороны, Мета там выступала (ссылку я похоже не сохранил) со своими водяными знаками, которые должны быть устойчивы ко многим преобразованиям.

"Watermarking Makes Language Models Radioactive"
https://neurips.cc/virtual/2024/poster/93506

С третьей стороны, народ изучает и скрытые пометки в тексте LLMов. И пришли к выводу, что если результаты одних LLMов используются в тренировке других, то пометки первых ЛЛМов вылезут и во вторых. В-общем, с расширением количества в интернетах текстов, сгенерированных ЛЛМами, скоро все их пометки будут везде.

Date: 2025-02-17 12:38 am (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Вычитание среднего будет работать только если ко всем изображениям прибавляется одинаковый водяной знак. В статье проводится разделение алгоритмов на contect agnostic и content sensitive, но это необязательно. Например, можно создать N разных водяных знаков, которые между собой некоррелированы, и применять один из них, выбранный для каждой новой картинки случайно. Получаем content agnostic метод, против которого описываемая атака не работает (потому что среднее будет к нулю стремиться).

Date: 2025-02-17 02:13 am (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Если водяные знаки некоррелированы, их среднее будет стремиться к нулю. Например, так работает GPS. Все спутники передают одновременно и постоянно на одной частоте, каждый модулирует свой псевдослучайный сигнал. На приёмнике стоит двенадцать корреляторов, каждый использует псевдослучайную последовательность своего спутника. Сигналы других спутников ему не мешают, потому что кросс корреляция равна нулю. Если все сигналы усреднить, получится тоже ноль (плюс шум).

Date: 2025-02-17 02:14 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Отсутствие корреляции именно это и означает. Там в числителе матожидание произведения отклонений. Псевдослучайные последовательности выбираются так, чтобы в автокорреляционной функции был только один пик, безо всяких лишних полосок.

Edited (сломанная ссылка) Date: 2025-02-17 02:14 pm (UTC)

Date: 2025-02-17 09:11 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Проверять на наличие одного из N возможных знаков. Так же как приёмник GPS одновременно принимает и декодирует сигналы нескольких спутников. Число N не обязано быть большим.

В картинках много избыточности, стеганографию прячут в младшие биты и размазывают по площади. На пустом кадре водяной знак может быть видно, особенно если поиграть с уровнями.

Date: 2025-02-17 10:00 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Чтобы заметно увеличить соотношение сигнал/шум (в данном случае водяной знак/исходная картинка), надо усреднить много изображений. Комбинаторика намекает, что количество возможных группировок растёт очень быстро, перебор в лоб вряд ли поможет.

June 2025

S M T W T F S
1 2 3 4 567
8 9101112 1314
15 16 1718192021
22232425262728
2930     

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 20th, 2025 07:48 am
Powered by Dreamwidth Studios