未分类

黑苹果MACOS GPU显卡性能比较

类型型号GPU 核心功耗 (TDP)性能表现(TFLOPs)Geekbench 6 Metal 跑分制程性价比
IntelUHD 6302415W0.5580514nm较高
AMDRX 4802304150W5.85138214nm较高
RX 560102475W2.62333714nm
RX 5802304185W6.25286314nm较高
RX 5902304225W7.15895812nm一般
RX 6800XT3840250W16.21977077nm较高
RX 6900XT5120300W23.02370417nm一般
RX 6950XT5120335W23.72166007nm较低
AppleM1815W不适用320295nm
M1 Pro1630W不适用656945nm
M1 Max3260W不适用1111275nm
M1 Ultra64120W不适用1604735nm
M21015W不适用433415nm
M2 Pro1930W不适用773975nm
M2 Max3860W不适用1324365nm
M2 Ultra76120W不适用2082875nm
M31015W不适用462743nm
M3 Pro1830W不适用739253nm
M3 Max4060W不适用1429883nm
M41015W不适用567043nm
M4 Pro1830W不适用1052613nm
M4 Max3260W不适用1800253nm
M4 Ultra64120W不适用未公布3nm
星期日, 24 11 月, 2024 未分类 没有评论

MAC处理器性能比较,从M1到M4

 苹果 M 系列芯片从 M1 到最新 M4 系列的综合性能对比表,包含基础版、Pro、Max 和 Ultra 版本的 CPU、GPU 核心数、最大内存、内存带宽、Geekbench 跑分、GPU Metal 跑分和理论 GPU 性能(TFLOPS)

芯片版本CPU 核心 (P/E)GPU 核心最大内存内存带宽单核跑分多核跑分GPU Metal 跑分GPU 性能 (TFLOPS)
M14P / 4E7 或 816GB68GB/s17007500~210002.6
M1 Pro6 或 8P / 2E14 或 1632GB200GB/s177012300~400005.2
M1 Max8 或 10P / 2E24 或 3264GB400GB/s178012750~6900010.4
M1 Ultra16P / 4E48 或 64128GB800GB/s180024000~11000021
M24P / 4E8 或 1024GB100GB/s19008700~250003.6
M2 Pro8 或 10P / 4E16 或 1932GB200GB/s195014900~490007.6
M2 Max12P / 4E30 或 3896GB400GB/s195015100~8300015.2
M2 Ultra24P / 8E60 或 76192GB800GB/s200028000~13500030.4
M34P / 4E8 或 1024GB100GB/s23009000~300004.5
M3 Pro6 或 8P / 4E14 或 1836GB150GB/s235016500~580009
M3 Max12P / 4E30 或 40128GB400GB/s238020800~9200018
M44P / 6E1032GB120GB/s260010500~330005
M4 Pro8 或 10P / 4E16 或 2064GB273GB/s270018000~6100010
M4 Max12P / 4E32 或 40128GB546GB/s275022000~9700020
M4 Ultra24P / 8E60 或 76192GB1000GB/s280029000~16000040
星期五, 8 11 月, 2024 未分类 没有评论

Stable diffusion 3(SD3) Lora训练

使用dreambooth训练自己的stable diffusion 3 Lora微调模型

train_dreambooth_lora_sd3.py参数说明

来自:https://github.com/huggingface/diffusers/blob/main/examples/dreambooth/train_dreambooth_lora_sd3.py

train_dreambooth_lora_sd3.py [-h] 
            --pretrained_model_name_or_path PRETRAINED_MODEL_NAME_OR_PATH  # 预训练模型的名称或路径
            [--revision REVISION]  # 模型的版本号
            [--variant VARIANT]  # 模型的变体
            [--dataset_name DATASET_NAME]  # 数据集的名称
            [--dataset_config_name DATASET_CONFIG_NAME]  # 数据集配置的名称
            [--instance_data_dir INSTANCE_DATA_DIR]  # 实例数据的目录
            [--cache_dir CACHE_DIR]  # 缓存目录
            [--image_column IMAGE_COLUMN]  # 图像列
            [--caption_column CAPTION_COLUMN]  # 标题列
            [--repeats REPEATS]  # 重复次数
            [--class_data_dir CLASS_DATA_DIR]  # 类别数据的目录
			
            --instance_prompt INSTANCE_PROMPT  # 实例提示
            [--class_prompt CLASS_PROMPT]  # 类别提示
            [--validation_prompt VALIDATION_PROMPT]  # 验证提示
            [--num_validation_images NUM_VALIDATION_IMAGES]  # 验证图像的数量
            [--validation_epochs VALIDATION_EPOCHS]  # 验证的轮数
            [--rank RANK]  # 排名
            [--with_prior_preservation]  # 是否保留先验
            [--prior_loss_weight PRIOR_LOSS_WEIGHT]  # 先验损失权重
            [--num_class_images NUM_CLASS_IMAGES]  # 类别图像的数量
            [--output_dir OUTPUT_DIR]  # 输出目录
            [--seed SEED]  # 随机种子
            [--resolution RESOLUTION]  # 分辨率
            [--center_crop]  # 是否进行中心裁剪
            [--random_flip]  # 是否进行随机翻转
            [--train_batch_size TRAIN_BATCH_SIZE]  # 训练批次大小
            [--sample_batch_size SAMPLE_BATCH_SIZE]  # 样本批次大小
            [--num_train_epochs NUM_TRAIN_EPOCHS]  # 训练的轮数
            [--max_train_steps MAX_TRAIN_STEPS]  # 最大训练步骤数
            [--checkpointing_steps CHECKPOINTING_STEPS]  # 检查点步骤数
            [--checkpoints_total_limit CHECKPOINTS_TOTAL_LIMIT]  # 检查点总数限制
            [--resume_from_checkpoint RESUME_FROM_CHECKPOINT]  # 从检查点恢复
            [--gradient_accumulation_steps GRADIENT_ACCUMULATION_STEPS]  # 梯度累积步骤数
            [--gradient_checkpointing]  # 是否进行梯度检查点
			
            [--learning_rate LEARNING_RATE]  # 学习率
            [--text_encoder_lr TEXT_ENCODER_LR]  # 文本编码器的学习率
            [--scale_lr]  # 是否缩放学习率
            [--lr_scheduler LR_SCHEDULER]  # 学习率调度器 (可选值: 'linear', 'cosine', 'cosine_with_restarts', 'polynomial', 'constant', 'constant_with_warmup')
            [--lr_warmup_steps LR_WARMUP_STEPS]  # 学习率预热步骤数
            [--lr_num_cycles LR_NUM_CYCLES]  # 学习率循环次数
            [--lr_power LR_POWER]  # 学习率的幂
            [--dataloader_num_workers DATALOADER_NUM_WORKERS]  # 数据加载器的工作线程数
            [--weighting_scheme {sigma_sqrt,logit_normal,mode}]  # 加权方案
            [--logit_mean LOGIT_MEAN]  # logit的均值
            [--logit_std LOGIT_STD]  # logit的标准差
            [--mode_scale MODE_SCALE]  # 模式缩放
            [--optimizer OPTIMIZER]  # 优化器 (可选值: 'adamw', 'adam', 'sgd')
            [--use_8bit_adam]  # 是否使用8位Adam优化器
            [--adam_beta1 ADAM_BETA1]  # Adam优化器的beta1参数
            [--adam_beta2 ADAM_BETA2]  # Adam优化器的beta2参数
            [--prodigy_beta3 PRODIGY_BETA3]  # Prodigy优化器的beta3参数
            [--prodigy_decouple PRODIGY_DECOUPLE]  # 是否解耦Prodigy优化器
            [--adam_weight_decay ADAM_WEIGHT_DECAY]  # Adam优化器的权重衰减
            [--adam_weight_decay_text_encoder ADAM_WEIGHT_DECAY_TEXT_ENCODER]  # 文本编码器的Adam优化器权重衰减
            [--adam_epsilon ADAM_EPSILON]  # Adam优化器的epsilon参数
            [--prodigy_use_bias_correction PRODIGY_USE_BIAS_CORRECTION]  # 是否使用Prodigy优化器的偏差校正
            [--prodigy_safeguard_warmup PRODIGY_SAFEGUARD_WARMUP]  # Prodigy优化器的保护预热
            [--max_grad_norm MAX_GRAD_NORM]  # 最大梯度范数
            [--push_to_hub]  # 是否推送到Hub
            [--hub_token HUB_TOKEN]  # Hub的令牌
            [--hub_model_id HUB_MODEL_ID]  # Hub模型ID
            [--logging_dir LOGGING_DIR]  # 日志目录
            [--allow_tf32]  # 是否允许使用TF32
            [--report_to REPORT_TO]  # 报告到 (可选值: 'tensorboard', 'wandb', 'comet_ml')
            [--mixed_precision {no,fp16,bf16}]  # 混合精度 (可选值: 'no', 'fp16', 'bf16')
            [--prior_generation_precision {no,fp32,fp16,bf16}]  # 先验生成精度 (可选值: 'no', 'fp32', 'fp16', 'bf16')
            [--local_rank LOCAL_RANK]  # 本地排名
			
星期二, 18 6 月, 2024 未分类 没有评论

解决MacOS中Terminal第一次打开卡顿几秒的BUG

$ sudo xcode-select -p
$ sudo xcode-select -switch /Library/Developer/CommandLineTools
$ sudo xcode-select -p
星期四, 8 12 月, 2022 未分类 没有评论

解决BigSur Arduino ESP8266编译错误

vi ~/Library/Arduino15/packages/esp8266/hardware/esp8266/2.7.4/tools/pyserial/serial/tools/list_ports_osx.py

#iokit = ctypes.cdll.LoadLibrary(ctypes.util.find_library('IOKit'))
#cf = ctypes.cdll.LoadLibrary(ctypes.util.find_library('CoreFoundation'))
iokit = ctypes.cdll.LoadLibrary('/System/Library/Frameworks/IOKit.framework/IOKit')
cf = ctypes.cdll.LoadLibrary('/System/Library/Frameworks/CoreFoundation.framework/CoreFoundation')
星期六, 2 1 月, 2021 未分类 没有评论

解决BigSur Arduino esp32 编译错误

cp ~/Library/Arduino15/packages/esp32/hardware/esp32/1.0.4/tools/esptool.py ~/Library/Arduino15/packages/esp32/tools/esptool_py/2.6.1/esptool.py

chmod 755 ~/Library/Arduino15/packages/esp32/tools/esptool_py/2.6.1/esptool.py

vi  /Library/Arduino15/packages/esp32/hardware/esp32/1.0.4/platform.txt

#tools.esptool_py.cmd=esptool
tools.esptool_py.cmd=esptool.py

sudo pip3 install pyserial
星期六, 2 1 月, 2021 未分类 没有评论

MacOs下git,maven,port,terminal使用代理

1 git

//全局配置
git config --global http.proxy socks5://127.0.0.1:1087
//编辑全局配置文件
git config --global -e
//取消全局配置
git config --global --unset http.proxy

2 maven

~/.m2/setting.xml

 <proxies>
     <proxy>
      <id>optional</id>
      <active>true</active>
      <protocol>http</protocol>
      <host>127.0.0。1</host>
      <port>1087</port>
      <nonProxyHosts>repo.njava.com</nonProxyHosts>
    </proxy>
</proxies>

//命令行方式
mvn clean compile -Dhttps.proxyHost=127.0.0.1 -Dhttps.proxyPort=1087

3 mac port

 /opt/local/etc/macports/macports.conf 

proxy_override_env yes 
proxy_http 127.0.0.1:1087

4 terminal

//1 命令行
export http_proxy=http://127.0.0.1:1087
//2 配置文件.bashrc或者.zshrc
export http_proxy="http://127.0.0.1:1087"
export https_proxy="http://127.0.0.1:1087"



星期一, 14 12 月, 2020 未分类 没有评论

2017 china region mysql dump

to ck

2017 china region mysql dump

region
school

星期三, 8 11 月, 2017 未分类 没有评论

使用Xdebug和KCachegrind分析php的discuz!x2.5运行CPU效率

论坛升级到discuz !x2.5,cpu随时都80-90%,load值居高不下,遂寻找一种检查php代码执行效率的方法
找到的方法php5-xdebug扩展或者xhprof扩展,因为服务器是ubuntu的,所以为了方便快捷,直接使用php5-xdebug来调试和分析了
1 xdebug配置

zend_extension=/usr/lib/php5/20090626/xdebug.so

xdebug.profiler_enable=on
xdebug.trace_output_dir="/tmp/xdebug"
xdebug.profiler_output_dir="/tmp/xdebug"
xdebug.profiler_output_name = cachegrind.out.%s  #cachegrind.out._home_httpd_xxxxx

/tmp/xdebug目录需要手工建立,并且给www用户的读写权限

2 分析xdebug日志
windows环境可以使用WinCacheGrind
  下载地址:http://sourceforge.net/projects/wincachegrind/
linux环境使KCachegrind

Tags: , , ,

星期二, 5 6 月, 2012 服务器, 未分类 没有评论
1LMooBmUE153Wnd3zDryWvDyXxQudbFxDr