@thes0ls

thes0ls@lemmy.eco.br · edit-2 20 hours ago

Pra quem tem um kindle e quiser fazer um backup local das suas compras enquanto dá tempo, este userscript pode ajudar:

https://raw.githubusercontent.com/chrishol/greasemonkey-scripts/refs/heads/main/download-all-kindle-books.js

Ele automatiza o processo de se baixar uma página inteira (25 itens) num só clique.

Só precisa editar o:
amazon.com/hz/mycd/digital-console/contentlist/booksAll/* para:
amazon.com.br/hz/mycd/digital-console/contentlist/booksAll/*
(ou seja, adicionar o .br)

E se preferir, também alterar o setTimeout(resolve, 14000) para algo como setTimeout(resolve, 5000) pra diminuir o intervalo de espera para cada download.

Depois é só ir no link https://www.amazon.com.br/hz/mycd/digital-console/contentlist/booksAll/dateAsc/ e clicar no botão do topo pra baixar. E repetir pra cada página.

::: spoiler ~~(e depois é só remover o drm pra ficar com um backup definitivo)~~ :::

thes0ls@lemmy.eco.br · edit-2 2 months ago

Pessoalmente, acho panetone em geral da Bauducco muito ruim. Não sei quão regional é a marca, mas um da Parati geralmente é bem mais barato e muito mais gostoso que um Bauducco.

Já dos caros, acho que Cacau Show e se não me engano Casa Suíça se salvam também.

thes0ls@lemmy.eco.br · 4 months ago

que monitoravam voos de Mark Zuckerberg

Mas quem leva o título no site da notícia é a Taylor Swift? Tá serto…

thes0ls@lemmy.eco.br · 5 months ago

No meu caso em específico, com bootloader desbloqueado + LineageOS + magisk (para root) + patches pra corrigir o Play Integrity:

BB, Mercado Pago e Nubank: nenhum problema.

Inter: No passado, na hora de logar aparecia uma mensagem informando que a rom não era a original e que no futuro eles poderiam barrar o acesso. Ultimamente está abrindo normal sem aparecer a mensagem.

Digio: Depois de uma atualização parou de funcionar e apresentava um código de erro na hora de logar na conta. Só consegui cancelar a minha conta lá pra evitar as cobranças logando em outro aparelho.

thes0ls@lemmy.eco.br · edit-2 7 months ago

Estranho, porque testei aqui e o koreader rodou normal os cbz que eu tenho. Dentro do arquivo é tudo .jpg mesmo ou algum formato diferente?

Outra alternativa de app seria o Mihon. O principal foco dele é usar com extensões que fazem ele abrir os sites de leitura online, mas ele oferece opção de leitura de arquivos locais também.

EDIT: Ah, vi agora que você já tinha comentado sobre o mihon antes.

thes0ls@lemmy.eco.br · 7 months ago

Isso, arquivo .cbr não é nada mais que um arquivo .rar renomeado (e .cbz é um arquivo .zip renomeado).

Então pra fazer virar um .cbz, basta extrair e depois empacotar de novo como zip e renomear pra .cbz

thes0ls@lemmy.eco.br · edit-2 7 months ago

No meu caso, eu empaquei aí porque no link de destino aparentemente é obrigatório ser um A record ( https://prosody.im/doc/dns#srv_records ), mas como todos os meus selfhosts são usando o argo tunnel do cloudflare, todos os meus (sub)domínios são CNAME.

E não consegui achar em nenhum canto alguém falando como rodar um servidor xmpp pelo argo.

thes0ls@lemmy.eco.br · 9 months ago

Fora que o arquivo sendo rodado tem aparentemente 14,9KB de tamanho.

De qualquer forma, eu também barraria o acesso ao arquivo porque ninguém merece um arquivo .avi em pleno 2024 🙈

thes0ls@lemmy.eco.br · 9 months ago

Dependendo pode ser interessante dar uma olhada no Tubular, que é um fork do NewPipe que implementa o SponsorBlock, que permite pular os trechos de publicidade/patrocínio dos vídeos usando banco de dados crowdsource. Também dá pra marcar os trechos e fazer os envios para o banco de dados pelo próprio app, assim a próxima pessoa que for assistir já será beneficiada.

Antigamente o app era chamado “NewPipeSponsorBlock”, mas aparentemente o pessoal do NewPipe não gostou por criar confusão com os nomes.

thes0ls@lemmy.eco.br · 10 months ago

Só pra ficar o aviso, apesar da frontend principal estar off, as frontends alternativas ainda estão funcionando:

thes0ls@lemmy.eco.br · 10 months ago

No meu caso foi reaproveitando PC velho mesmo, inclusive era tudo com os gabinetes grandões todo sucateado.

Mas dependendo da verba, até um raspberry pi pode ser interessante pra começar a mexer.

O legal do raspberry é que basta você trocar um cartão SD que você consegue ter um sistema operacional diferente. Então quando quiser brincar como servidor, coloca um cartão SD com um ubuntu server da vida e nem precisa ligar num monitor.

E se gostar de jogar joguinhos antigos, bota um SD com batocera ou coisa do tipo e liga numa tela via HDMI pra jogar uns Super Nintendo ou assistir coisas pelo Kodi.

Alias como faz os backup nos hdd no home server para se um ir de arrasta pra cima n perde as coisas

Acho que raid seja uma alternativa?

No meu caso, raid “desperdiçaria” muito hdd, então eu vou na fé e só programo as coisas mais importantes pra rodar uns backups periodicamente e salvar numa pasta que tá sincronizada via syncthing com o meu desktop.

thes0ls@lemmy.eco.br · edit-2 10 months ago

Na verdade, a única parte que fica “verificada” é o link do site presente na bio do mastodon.

Então no seu site pessoal (https://fulanodetal.com.zz), você precisa adicionar um link apontando pro seu mastodon, com a tag rel="me" (<a href="https://algumainstanciadomastodon.com.zz/@fulanodetal" rel="me">Meu Mastodon</a>) e depois no seu perfil do mastodon você adiciona o link do seu site(https://fulanodetal.com.zz) e automagicamente o link era pra aparecer verdinho na sua bio.

Mas acho que isso só vai afetar o link na bio/perfil do mastodon, pelo que eu saiba, pra ficar como SeuUsuário@fulanodetal.com.zz seria necessário que você hospedasse uma instância própria no seu site.

thes0ls@lemmy.eco.br · 10 months ago

Olha, eu mantenho um servidor local rodando direto acho que faz uns 20 anos já.

Este é o primeiro mais potente que eu uso, o resto era tudo de PC baixo custo velho que a placa-mãe vinha até com processador já embutido. Muito provavelmente eram mais fracos que um raspberry pi 3 da vida.

Mesmo sendo fraquinhos, dava pra hospedar legal as coisas localmente. Só quando precisava compilar algo que tinha que ter uma paciência enorme.

Então, se a ideia é tentar brincar de selfhost, acho que dá pra começar com qualquer equipamento, seja um PC/notebook velho ou um raspberry da vida.

A propósito, vendo as mensagens antigas, o Synapse aqui normalizou depois de uns 2 dias e não voltou mais a comer processamento fora do normal.

thes0ls@lemmy.eco.br · edit-2 11 months ago

Abri aqui o link da ursal.zone e vários comentários do mastodon não apareceram aqui no lemmy, então vamos ver se pelo menos a resposta chega.

@[email protected]

esse esquema de mirror do Telegram/WhatsApp é bem legal: nem parece coisa aberta, parece ter algum contrato entre desenvolvedores do matrix e provedores dos serviços fechados pra possibilitar isso!

A bridge que eu uso não feita pelo próprio matrix, mas sim do maunium, que imagino que foi feito caçando as chamadas da api mesmo.

Parece que algo similar tem para o xmpp também: https://slidge.im/slidge-whatsapp/

sua conexão é qual ae?

Tenho fibra 600mbps, mas a maioria do que eu faço selfhost é pra uso pessoal e acaba sendo usado mais na rede local mesmo.

tesseract funciona com áudio? Achei que fosse só OCR

Falha minha. Fui caçar os scripts antigos aqui e ele também tinha o tesseract logo antes, mas na verdade era o sr. O tesseract de fato tava lá só pra lidar com imagens.

@[email protected]

Queria entender o modus operandis, se é automático, se preciso deixar aberto em um navegador / sessão ativa para o bot fazer o processo e me devolver…

É um script em python, que roda como se fosse um app/client normal. No caso ele fica rodando de fundo o tempo todo no computador.

EDIT:

E pelo jeito eu falhei em como usar as mentions :v

thes0ls@lemmy.eco.br · 11 months ago

Só pra ficar registrado, não sei se os edits estão sendo federados corretamente, então o link pra versão mais atualizada tá aqui: https://lemmy.eco.br/comment/6300628

thes0ls@lemmy.eco.br · edit-2 11 months ago

Welp que eu acabei mesmo passando a limpo o meu script.

Aqui estou levando em conta que o matrix já está com a bridge rodando e o script vai cuidar só de espiar se chega mensagem de áudio.

Quem for usar, leia o código que eu botei uns comentários nos trechos que deve editar.

Testei só no meu próprio ambiente, então pode ser que tenha uma dependência ou outra que esqueci de anotar (nem lembro como que instalei o whisper, por exemplo).

A documentação do nio fica em aqui: https://matrix-nio.readthedocs.io/en/latest/index.html

# -*- coding: utf-8 -*-


import requests

import os
import re
import time

import whisper

import asyncio
import json

from nio import AsyncClient, MatrixRoom, RoomMessageText, RoomMessageAudio, Api

# whisper requer o ffmpeg:
# sudo apt update && sudo apt install ffmpeg

# E no virtualenv do seu python, os requisitos provavelmente são:
# pip install asyncio openai-whisper matrix-nio

# Analisar o restante do script e substituir os valores do room_id na função audio_callback pelos da sua instância

# ------------------------------------------------

# Credenciais do login. Pegar os dados da response:
# curl -XPOST -d '{"type":"m.login.password", "user":"NOMEDOUSUARIO", "password":"SENHADOUSUARIO"}' "https://matrix.zzz/_matrix/client/r0/login"
CONFIG_FILE = "matrix-credentials.json"
if not os.path.isfile(CONFIG_FILE):
  f = open(CONFIG_FILE, 'w')
  f.write('{"user_id":"@usuario:matrix.zzz","access_token":"abc123","home_server":"https://matrix.zzz","device_id":"ABCD"}')
  f.close()
  print('Preencha as credenciais...')
  exit()
  
# Este arquivo é usado pro script ignorar mensagens anteriores a data dele
lastruntime='matrix.time.txt'
if not os.path.isfile(lastruntime):
  f = open(lastruntime, 'w')
  f.write("0")
  f.close()

# Pasta onde ficarão salvos os áudio temporários
if not os.path.isdir("matrixtemp"):
    os.mkdir("matrixtemp")

with open(CONFIG_FILE, "r") as f:
    config = json.load(f)
    client = AsyncClient(config["home_server"])
    client.access_token = config["access_token"]
    client.user_id = config["user_id"]
    client.device_id = config["device_id"]

async def matrix_message(text, room_id, server_timestamp, in_reply_to = 0):
    event_type="m.room.message"
    msgtype="m.text"
        
    if in_reply_to == 0:
        content = {
                "msgtype": msgtype,
                "body": cleanhtml(text),
                "format": "org.matrix.custom.html",
                "formatted_body": text
        }
    else:
        content = {
                "m.relates_to": {"m.in_reply_to": {"event_id": in_reply_to  }   },
                "msgtype": msgtype,
                "body": cleanhtml(text),
                "format": "org.matrix.custom.html",
                "formatted_body": text
        }
    
    await client.room_send(
        room_id,
        message_type="m.room.message",
        content=content,
        ignore_unverified_devices=True,
    )
    
    f = open(lastruntime, "w")
    f.write(str(server_timestamp))
    f.close()
    

CLEANR = re.compile('<.*?>') 

def cleanhtml(raw_html):
  cleantext = re.sub(CLEANR, '', raw_html)
  return cleantext
  

async def audio_callback(room: MatrixRoom, event: RoomMessageAudio) -> None:
    # Aqui os chats que podem receber a transcrição na própria conversa.
    # Pra pegar o id, no Element, clique direito na sala, Settings > Advanced > Internal room ID
    permitidos=[
    "!AsasasASas:matrix.zzz",
    "!Idasasas:matrix.zzz"
    ]
    if room.room_id in permitidos:    
        room_id = room.room_id
        event_id = event.event_id
    else:
        room_id = "!BHBhbHBHbhb:matrix.zzz" # Aqui especifica o room_id do chat que vai receber fora dos permitidos acima
        event_id = 0
    
    sender = event.source['sender']
    lastrun = open(lastruntime, "r")
    lastrun = lastrun.read()
    if event.server_timestamp > int(lastrun):
        print(vars(room))
        print(event)
        dllink = Api.mxc_to_http(event.source['content']['url'])
        print(dllink)
        filename = os.path.basename(dllink)+".ogg"
        filepath = "./matrixtemp/"+filename
        
        r = requests.get(dllink)
        
        print(r.status_code)
        
        with open(filepath, 'wb') as f:
            f.write(r.content)
        
        print("iniciando openai/whisper")
        start = time.time()
        model = whisper.load_model("medium")
        
        whisperconfig="bs3" #def p2bs5 bs3 bs2
        
        if whisperconfig == "p2bs5":
            result = model.transcribe(filepath, language="pt", fp16=False, verbose=True, patience=2, beam_size=5) #580 segundos
        if whisperconfig == "def":
            result = model.transcribe(filepath, language="pt", fp16=False, verbose=True) #56 segundos
        if whisperconfig == "bs3":
            result = model.transcribe(filepath, language="pt", fp16=False, verbose=True, beam_size=3) #181 segundos
        if whisperconfig == "bs2":
            result = model.transcribe(filepath, language="pt", fp16=False, verbose=True, beam_size=2) #136 segundos
            
        end = time.time()
        tempogasto = int(end - start)
        print("Conluido, tempo gasto: "+ str(tempogasto))
        text = result["text"]

        await matrix_message("<b>Transcrição:</b><br/><br/>"+sender+":<br/> "+text, room_id, str(event.server_timestamp), event_id)



async def main() -> None:        
    client.add_event_callback(audio_callback, RoomMessageAudio)
    
    await client.sync_forever(timeout=30000)  # milliseconds


asyncio.run(main())

EDIT: 2024-03-27 21h50: Corrigi um erro de copicola logo depois do if not os.path.isfile(CONFIG_FILE):.

thes0ls@lemmy.eco.br · edit-2 11 months ago

Hahah, tá no meio de um script enorme que eu também uso pra fazer o mirror das outras mensagens. Qualquer coisa alguma hora eu vejo se tento isolar só isso, mas pra dar um início seria:

Um script python com nio, que serve pra conectar no servidor, logar na conta e ficar espiando as mensagens que vão chegando.

Quando ele encontrar uma mensagem de áudio, eu faço ele baixar o arquivo numa pasta local e depois eu rodo o whisper hospedado localmente pra fazer a transcrição.

Depois com o resultado, eu tenho duas opções, enviar de volta o áudio para o mesmo chat, ou enviar pra um chat privado só comigo. Quando é com alguém chegado, eu envio pro mesmo chat, já o restante eu faço vir em separado.

Inicialmente eu usava o sr*, mas se a pessoa tinha um pouco de sotaque, o reconhecimento não funcionava legal.

Com o whisper o resultado é bem melhor, porém é bem mais pesado e demora um tanto pra transcrever. Um áudio de 30 segundos leva uns 3~4 minutos. Mas se a pessoa quis economizar o tempo dela enviando em audio, não deve se importar de esperar uns 5 minutos pra receber uma resposta do outro lado… hahah

*EDIT: Uma correção, o meu script também tava com o tesseract sendo usado em outro trecho, por isso eu confundi, mas a parte do audio era usando o SpeechRecognition. Foi mals. EDIT

thes0ls@lemmy.eco.br · edit-2 11 months ago

O problema é que é totalmente aleatório. Ontem às 22h tava comendo os 35% de novo. Reiniciei o container e tá até agora rodando bonitinho consumindo de 1% pra baixo.

No dendrite eu não tinha notado esses problemas.

alias gastou quanto pra criar servidor doméstico?

Um fornecedor do meu irmão tava se desfazendo de equipamentos antigos e peguei um “HP Prodesk 600 Slim”, acho que um i5 e 8gb de ram e um hdd mecânico de 500GB por uns R$600.

Só botei mais uns pentes de memória que eu tinha sobrando aqui e um ssd, que também tinha de sobra.

EDIT:

Btw, não sei se é bug, mas só consegui fazer o upload da imagem pela interface normal, tentando pelo old.lemmy só retornava erro.

thes0ls@lemmy.eco.br · edit-2 11 months ago

Tenho feito selfhost de uma instância do matrix desde o ano passado.

A ideia era criar um mirror do grupo de trabalho do telegram (que vinha sendo ameaçado de bloqueios na época) e migrar pro matrix caso fosse necessário.

No fim, o meu provedor “esqueceu” de bloquear o telegram e acabou dando em nada.

Assim o matrix continuou só como um mirror e aproveitei para botar uma bridge do meu whatsapp pessoal lá, principalmente pra deixar rodando um script pra transcrever as mensagens de áudio que eu recebo e agora não consigo mais ficar sem isso.

Na época eu tinha optado por usar o Dendrite, que dizia ser uma versão mais enxuta do que o Synapse (que é o servidor padrão). Tava tudo redondo, até que recentemente as bridges foram atualizadas e passaram a precisar da api versão 1.4, mas o Dendrite meio que estagnou e tá empacado na api 1.2 ainda.

Então tentei instalar o Synapse aqui, mas aleatoriamente ele começa a comer 35% da CPU (de um i5-4590). Se eu reiniciar o container dele, normaliza por um tempo, mas depois de algumas horas volta a pesar de novo.

O próximo passo vai ser testar o Matrix Conduit pra ver :|

thes0ls@lemmy.eco.br · 1 year ago

Ia dizer que é o que eu uso, mas na verdade é outro fork.

No PC eu tenho o KeePassXC (em conjunto com o addon KeePassXC-Browser do firefox). E no android eu tenho o Kepass2Android Offline, que eu uso como read-only.

E pra sincronizar do pc pro android uso Syncthing.