Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Bug] downloading a thread from desuarchive creates an archive that some Linux tools consider broken / при скачивании треда с desuarchive нет .html #1497

Open
aleksejrs opened this issue Aug 25, 2024 · 4 comments
Labels
board related The issue is related to a specific imageboard bug Something isn't working can't reproduce Issue cannot be reproduced. Need more info.

Comments

@aleksejrs
Copy link

aleksejrs commented Aug 25, 2024

  1. При скачивании треда в архиве отсутствует .html с постами.
  2. На desuarchive. В архивах с 4chan .html есть.

Firefox:

Empty string passed to getElementById(). 3 jquery.min.js:2:7681
Content-Security-Policy: The page’s settings blocked the loading of a resource (img-src) at data:image/gif;base64,R0lGODlhEAAQAKIAAP… because it violates the following directive: “img-src 'self' https://desuarchive.org https://desu-usergeneratedcontent.xyz https://www.gravatar.com” 2 Dollchan_Extension_Tools.es6.user.js:6016:50
TypeError: input is null
6 Dollchan_Extension_Tools.es6.user.js:2257:20
Empty string passed to getElementById(). 3 jquery.min.js:2:7681
Cookie warnings 2

Tor Browser:

Empty string passed to getElementById(). 3 jquery.min.js:2:7680
Content-Security-Policy: The page’s settings blocked the loading of a resource at data:image/gif;base64,R0lGODlhEAAQAKIAAP… (“img-src”). 2 Dollchan_Extension_Tools.es6.user.js:6016:49
Some cookies are misusing the recommended “SameSite“ attribute 4
Empty string passed to getElementById(). 3 jquery.min.js:2:7680

Описание браузера и Dollchan

  1. Firefox 129.0.2 (64-bit) или Tor Browser 13.5.2 (based on Mozilla Firefox 115.14.0esr)
  2. Dollchan v23.9.18.0
  3. расширение

Шаги для воспроизведения поведения ошибки

  1. Перейти к https://desuarchive.org/g/thread/101503511#101503571
  2. Нажать «Download thread»
  3. Скачивается архив с каталогом data/ и, если удалось скачать, images/ и thumbs/, но без .html-файла.
@aleksejrs aleksejrs added the bug Something isn't working label Aug 25, 2024
@aleksejrs aleksejrs changed the title [Bug] при скачивании треда с desuarchive нет .html [Bug] No .html when downloading a thread from desuarchive / при скачивании треда с desuarchive нет .html Aug 25, 2024
@SthephanShinkufag SthephanShinkufag added can't reproduce Issue cannot be reproduced. Need more info. board related The issue is related to a specific imageboard labels Sep 15, 2024
@SthephanShinkufag
Copy link
Owner

SthephanShinkufag commented Sep 15, 2024

Firefox 130.0 (64-bit) с расширением v23.9.18.0 - скачал несколько тредов с разных досок, треды скачиваются нормально.
Скрипт с гризманки тоже работает.

TypeError: input is null
6 Dollchan_Extension_Tools.es6.user.js:2257:20

В консоли ваша ошибка указывает, что какой-то контент не удаётся добавить в архив, но причину выяснить не могу. У меня этой ошибки нет, нужно добиться её самому.

@aleksejrs
Copy link
Author

aleksejrs commented Sep 15, 2024

Похоже, всё скачивается, но tar файлы именно с desuarchive повреждены, и не всё может их распаковать.

При их монтировании с помощью archivemount отображается не всё. В архивах прямо с 4chan файл отображается.

Debian

$ archivemount  --version 
archivemount version 1-1
libarchive 3.7.4 zlib/1.3.1 liblzma/5.6.2 bz2lib/1.0.8 liblz4/1.9.4 libzstd/1.5.6 (header 3.7.4)
FUSE library version 3.14.0
using FUSE kernel interface version 7.31
fusermount3 version: 3.14.0

aunpack показывает после html-файла ошибку, но файл цел:

tar: Exiting with failure status due to previous errors
aunpack: tar ...: non-zero return-code

@SthephanShinkufag
Copy link
Owner

SthephanShinkufag commented Sep 15, 2024

скачал несколько тредов с разных досок

Неправильно выразился. С разных досок на desuarchive, например https://desuarchive.org/a/ или https://desuarchive.org/g/
Я виндоюзер, 7zip всё распаковывает, там есть тестирование, ошибок не находит. Похоже, 7zip более дубовый и ему пофиг, а линупсовым утилитам видимо что-то не нравится.

@aleksejrs
Copy link
Author

aleksejrs commented Sep 15, 2024

Да, для 7-Zip 24.08 всё нормально.

@aleksejrs aleksejrs changed the title [Bug] No .html when downloading a thread from desuarchive / при скачивании треда с desuarchive нет .html [Bug] downloading a thread from desuarchive creates an archive that some Linux tools consider broken / при скачивании треда с desuarchive нет .html Sep 17, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
board related The issue is related to a specific imageboard bug Something isn't working can't reproduce Issue cannot be reproduced. Need more info.
Projects
None yet
Development

No branches or pull requests

2 participants