added more fixed LR tests, added ipynbs
148
.gitignore
vendored
@ -1,5 +1,147 @@
|
||||
*~*
|
||||
*#
|
||||
# Byte-compiled / optimized / DLL files
|
||||
__pycache__/
|
||||
*.py[cod]
|
||||
*$py.class
|
||||
.vscode
|
||||
poetry.lock
|
||||
|
||||
*.pdf
|
||||
*~*
|
||||
*#*
|
||||
*.bak
|
||||
*.sav
|
||||
*.asv
|
||||
!final-report.pdf
|
||||
|
||||
# C extensions
|
||||
*.so
|
||||
|
||||
# Distribution / packaging
|
||||
.Python
|
||||
build/
|
||||
develop-eggs/
|
||||
dist/
|
||||
downloads/
|
||||
eggs/
|
||||
.eggs/
|
||||
lib/
|
||||
lib64/
|
||||
parts/
|
||||
sdist/
|
||||
var/
|
||||
wheels/
|
||||
share/python-wheels/
|
||||
*.egg-info/
|
||||
.installed.cfg
|
||||
*.egg
|
||||
MANIFEST
|
||||
|
||||
# PyInstaller
|
||||
# Usually these files are written by a python script from a template
|
||||
# before PyInstaller builds the exe, so as to inject date/other infos into it.
|
||||
*.manifest
|
||||
*.spec
|
||||
|
||||
# Installer logs
|
||||
pip-log.txt
|
||||
pip-delete-this-directory.txt
|
||||
|
||||
# Unit test / coverage reports
|
||||
htmlcov/
|
||||
.tox/
|
||||
.nox/
|
||||
.coverage
|
||||
.coverage.*
|
||||
.cache
|
||||
nosetests.xml
|
||||
coverage.xml
|
||||
*.cover
|
||||
*.py,cover
|
||||
.hypothesis/
|
||||
.pytest_cache/
|
||||
cover/
|
||||
|
||||
# Translations
|
||||
*.mo
|
||||
*.pot
|
||||
|
||||
# Django stuff:
|
||||
*.log
|
||||
local_settings.py
|
||||
db.sqlite3
|
||||
db.sqlite3-journal
|
||||
|
||||
# Flask stuff:
|
||||
instance/
|
||||
.webassets-cache
|
||||
|
||||
# Scrapy stuff:
|
||||
.scrapy
|
||||
|
||||
# Sphinx documentation
|
||||
docs/_build/
|
||||
|
||||
# PyBuilder
|
||||
.pybuilder/
|
||||
target/
|
||||
|
||||
# Jupyter Notebook
|
||||
.ipynb_checkpoints
|
||||
|
||||
# IPython
|
||||
profile_default/
|
||||
ipython_config.py
|
||||
|
||||
# pyenv
|
||||
# For a library or package, you might want to ignore these files since the code is
|
||||
# intended to run in multiple environments; otherwise, check them in:
|
||||
# .python-version
|
||||
|
||||
# pipenv
|
||||
# According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
|
||||
# However, in case of collaboration, if having platform-specific dependencies or dependencies
|
||||
# having no cross-platform support, pipenv may install dependencies that don't work, or not
|
||||
# install all needed dependencies.
|
||||
#Pipfile.lock
|
||||
|
||||
# PEP 582; used by e.g. github.com/David-OConnor/pyflow
|
||||
__pypackages__/
|
||||
|
||||
# Celery stuff
|
||||
celerybeat-schedule
|
||||
celerybeat.pid
|
||||
|
||||
# SageMath parsed files
|
||||
*.sage.py
|
||||
|
||||
# Environments
|
||||
.env
|
||||
.venv
|
||||
env/
|
||||
venv/
|
||||
ENV/
|
||||
env.bak/
|
||||
venv.bak/
|
||||
|
||||
# Spyder project settings
|
||||
.spyderproject
|
||||
.spyproject
|
||||
|
||||
# Rope project settings
|
||||
.ropeproject
|
||||
|
||||
# mkdocs documentation
|
||||
/site
|
||||
|
||||
# mypy
|
||||
.mypy_cache/
|
||||
.dmypy.json
|
||||
dmypy.json
|
||||
|
||||
# Pyre type checker
|
||||
.pyre/
|
||||
|
||||
# pytype static type analyzer
|
||||
.pytype/
|
||||
|
||||
# Cython debug symbols
|
||||
cython_debug/
|
||||
|
12
cars/lr-investigations/fixed/1e-1/README.md
Normal file
@ -0,0 +1,12 @@
|
||||
Top-1 accuracy
|
||||
0.8%
|
||||
|
||||
|
||||
Top-5 accuracy
|
||||
2.78%
|
||||
|
||||
last val loss:
|
||||
5.29
|
||||
|
||||
last val accuracy:
|
||||
0.55
|
197
cars/lr-investigations/fixed/1e-1/conf.csv
Normal file
341
cars/lr-investigations/fixed/1e-1/deploy.prototxt
Normal file
@ -0,0 +1,341 @@
|
||||
input: "data"
|
||||
input_shape {
|
||||
dim: 1
|
||||
dim: 3
|
||||
dim: 227
|
||||
dim: 227
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
}
|
BIN
cars/lr-investigations/fixed/1e-1/large.png
Normal file
After Width: | Height: | Size: 135 KiB |
388
cars/lr-investigations/fixed/1e-1/original.prototxt
Normal file
@ -0,0 +1,388 @@
|
||||
name: "AlexNet"
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "train"
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 128
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 32
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
exclude {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
include {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
1619
cars/lr-investigations/fixed/1e-1/pred.csv
Normal file
BIN
cars/lr-investigations/fixed/1e-1/small.png
Normal file
After Width: | Height: | Size: 134 KiB |
13
cars/lr-investigations/fixed/1e-1/solver.prototxt
Normal file
@ -0,0 +1,13 @@
|
||||
test_iter: 51
|
||||
test_interval: 102
|
||||
base_lr: 0.1
|
||||
display: 12
|
||||
max_iter: 20400
|
||||
lr_policy: "fixed"
|
||||
momentum: 0.89999998
|
||||
weight_decay: 0.001
|
||||
snapshot: 102
|
||||
snapshot_prefix: "snapshot"
|
||||
solver_mode: GPU
|
||||
net: "train_val.prototxt"
|
||||
solver_type: SGD
|
382
cars/lr-investigations/fixed/1e-1/train_val.prototxt
Normal file
@ -0,0 +1,382 @@
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TRAIN
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/train_db"
|
||||
batch_size: 128
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/val_db"
|
||||
batch_size: 32
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
}
|
18
cars/lr-investigations/fixed/1e-2/README.md
Normal file
@ -0,0 +1,18 @@
|
||||
Top-1 accuracy
|
||||
13.65%
|
||||
|
||||
|
||||
Top-5 accuracy
|
||||
30.02%
|
||||
|
||||
last val loss:
|
||||
4.15
|
||||
|
||||
lowest val loss:
|
||||
2.91
|
||||
|
||||
last val accuracy:
|
||||
17.46
|
||||
|
||||
higest val accuracy:
|
||||
35.48
|
197
cars/lr-investigations/fixed/1e-2/conf.csv
Normal file
341
cars/lr-investigations/fixed/1e-2/deploy.prototxt
Normal file
@ -0,0 +1,341 @@
|
||||
input: "data"
|
||||
input_shape {
|
||||
dim: 1
|
||||
dim: 3
|
||||
dim: 227
|
||||
dim: 227
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
}
|
BIN
cars/lr-investigations/fixed/1e-2/large.png
Normal file
After Width: | Height: | Size: 379 KiB |
388
cars/lr-investigations/fixed/1e-2/original.prototxt
Normal file
@ -0,0 +1,388 @@
|
||||
name: "AlexNet"
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "train"
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 128
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 32
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
exclude {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
include {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
1619
cars/lr-investigations/fixed/1e-2/pred.csv
Normal file
BIN
cars/lr-investigations/fixed/1e-2/small.png
Normal file
After Width: | Height: | Size: 252 KiB |
13
cars/lr-investigations/fixed/1e-2/solver.prototxt
Normal file
@ -0,0 +1,13 @@
|
||||
test_iter: 51
|
||||
test_interval: 102
|
||||
base_lr: 0.0099999998
|
||||
display: 12
|
||||
max_iter: 20400
|
||||
lr_policy: "fixed"
|
||||
momentum: 0.89999998
|
||||
weight_decay: 9.9999997e-05
|
||||
snapshot: 102
|
||||
snapshot_prefix: "snapshot"
|
||||
solver_mode: GPU
|
||||
net: "train_val.prototxt"
|
||||
solver_type: SGD
|
382
cars/lr-investigations/fixed/1e-2/train_val.prototxt
Normal file
@ -0,0 +1,382 @@
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TRAIN
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/train_db"
|
||||
batch_size: 128
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/val_db"
|
||||
batch_size: 32
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
}
|
12
cars/lr-investigations/fixed/5e-2/README.md
Normal file
@ -0,0 +1,12 @@
|
||||
Top-1 accuracy
|
||||
1.79%
|
||||
|
||||
|
||||
Top-5 accuracy
|
||||
6.73%
|
||||
|
||||
last val loss:
|
||||
5.13
|
||||
|
||||
last val accuracy:
|
||||
1.78
|
197
cars/lr-investigations/fixed/5e-2/conf.csv
Normal file
341
cars/lr-investigations/fixed/5e-2/deploy.prototxt
Normal file
@ -0,0 +1,341 @@
|
||||
input: "data"
|
||||
input_shape {
|
||||
dim: 1
|
||||
dim: 3
|
||||
dim: 227
|
||||
dim: 227
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
}
|
BIN
cars/lr-investigations/fixed/5e-2/large.png
Normal file
After Width: | Height: | Size: 258 KiB |
388
cars/lr-investigations/fixed/5e-2/original.prototxt
Normal file
@ -0,0 +1,388 @@
|
||||
name: "AlexNet"
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "train"
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 128
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 32
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
exclude {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
include {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
1619
cars/lr-investigations/fixed/5e-2/pred.csv
Normal file
BIN
cars/lr-investigations/fixed/5e-2/small.png
Normal file
After Width: | Height: | Size: 191 KiB |
13
cars/lr-investigations/fixed/5e-2/solver.prototxt
Normal file
@ -0,0 +1,13 @@
|
||||
test_iter: 51
|
||||
test_interval: 102
|
||||
base_lr: 0.050000001
|
||||
display: 12
|
||||
max_iter: 20400
|
||||
lr_policy: "fixed"
|
||||
momentum: 0.89999998
|
||||
weight_decay: 0.00050000002
|
||||
snapshot: 102
|
||||
snapshot_prefix: "snapshot"
|
||||
solver_mode: GPU
|
||||
net: "train_val.prototxt"
|
||||
solver_type: SGD
|
382
cars/lr-investigations/fixed/5e-2/train_val.prototxt
Normal file
@ -0,0 +1,382 @@
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TRAIN
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/train_db"
|
||||
batch_size: 128
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/val_db"
|
||||
batch_size: 32
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
}
|
12
cars/lr-investigations/fixed/5e-3/README.md
Normal file
@ -0,0 +1,12 @@
|
||||
Top-1 accuracy
|
||||
39.35%
|
||||
|
||||
|
||||
Top-5 accuracy
|
||||
66.83%
|
||||
|
||||
last val loss:
|
||||
3.34
|
||||
|
||||
last val accuracy:
|
||||
43.50
|
197
cars/lr-investigations/fixed/5e-3/conf.csv
Normal file
341
cars/lr-investigations/fixed/5e-3/deploy.prototxt
Normal file
@ -0,0 +1,341 @@
|
||||
input: "data"
|
||||
input_shape {
|
||||
dim: 1
|
||||
dim: 3
|
||||
dim: 227
|
||||
dim: 227
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
}
|
BIN
cars/lr-investigations/fixed/5e-3/large.png
Normal file
After Width: | Height: | Size: 304 KiB |
388
cars/lr-investigations/fixed/5e-3/original.prototxt
Normal file
@ -0,0 +1,388 @@
|
||||
name: "AlexNet"
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "train"
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 128
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
}
|
||||
data_param {
|
||||
batch_size: 32
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
stage: "val"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
exclude {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "softmax"
|
||||
type: "Softmax"
|
||||
bottom: "fc8"
|
||||
top: "softmax"
|
||||
include {
|
||||
stage: "deploy"
|
||||
}
|
||||
}
|
1619
cars/lr-investigations/fixed/5e-3/pred.csv
Normal file
BIN
cars/lr-investigations/fixed/5e-3/small.png
Normal file
After Width: | Height: | Size: 220 KiB |
13
cars/lr-investigations/fixed/5e-3/solver.prototxt
Normal file
@ -0,0 +1,13 @@
|
||||
test_iter: 51
|
||||
test_interval: 102
|
||||
base_lr: 0.0049999999
|
||||
display: 12
|
||||
max_iter: 20400
|
||||
lr_policy: "fixed"
|
||||
momentum: 0.89999998
|
||||
weight_decay: 4.9999999e-05
|
||||
snapshot: 102
|
||||
snapshot_prefix: "snapshot"
|
||||
solver_mode: GPU
|
||||
net: "train_val.prototxt"
|
||||
solver_type: SGD
|
382
cars/lr-investigations/fixed/5e-3/train_val.prototxt
Normal file
@ -0,0 +1,382 @@
|
||||
layer {
|
||||
name: "train-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TRAIN
|
||||
}
|
||||
transform_param {
|
||||
mirror: true
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/train_db"
|
||||
batch_size: 128
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "val-data"
|
||||
type: "Data"
|
||||
top: "data"
|
||||
top: "label"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
transform_param {
|
||||
crop_size: 227
|
||||
mean_file: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/mean.binaryproto"
|
||||
}
|
||||
data_param {
|
||||
source: "/mnt/bigdisk/DIGITS-AIN-3/digits/jobs/20210401-115716-aaf7/val_db"
|
||||
batch_size: 32
|
||||
backend: LMDB
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv1"
|
||||
type: "Convolution"
|
||||
bottom: "data"
|
||||
top: "conv1"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 96
|
||||
kernel_size: 11
|
||||
stride: 4
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu1"
|
||||
type: "ReLU"
|
||||
bottom: "conv1"
|
||||
top: "conv1"
|
||||
}
|
||||
layer {
|
||||
name: "norm1"
|
||||
type: "LRN"
|
||||
bottom: "conv1"
|
||||
top: "norm1"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool1"
|
||||
type: "Pooling"
|
||||
bottom: "norm1"
|
||||
top: "pool1"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv2"
|
||||
type: "Convolution"
|
||||
bottom: "pool1"
|
||||
top: "conv2"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 2
|
||||
kernel_size: 5
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu2"
|
||||
type: "ReLU"
|
||||
bottom: "conv2"
|
||||
top: "conv2"
|
||||
}
|
||||
layer {
|
||||
name: "norm2"
|
||||
type: "LRN"
|
||||
bottom: "conv2"
|
||||
top: "norm2"
|
||||
lrn_param {
|
||||
local_size: 5
|
||||
alpha: 9.9999997e-05
|
||||
beta: 0.75
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "pool2"
|
||||
type: "Pooling"
|
||||
bottom: "norm2"
|
||||
top: "pool2"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "conv3"
|
||||
type: "Convolution"
|
||||
bottom: "pool2"
|
||||
top: "conv3"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu3"
|
||||
type: "ReLU"
|
||||
bottom: "conv3"
|
||||
top: "conv3"
|
||||
}
|
||||
layer {
|
||||
name: "conv4"
|
||||
type: "Convolution"
|
||||
bottom: "conv3"
|
||||
top: "conv4"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 384
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu4"
|
||||
type: "ReLU"
|
||||
bottom: "conv4"
|
||||
top: "conv4"
|
||||
}
|
||||
layer {
|
||||
name: "conv5"
|
||||
type: "Convolution"
|
||||
bottom: "conv4"
|
||||
top: "conv5"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
convolution_param {
|
||||
num_output: 256
|
||||
pad: 1
|
||||
kernel_size: 3
|
||||
group: 2
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu5"
|
||||
type: "ReLU"
|
||||
bottom: "conv5"
|
||||
top: "conv5"
|
||||
}
|
||||
layer {
|
||||
name: "pool5"
|
||||
type: "Pooling"
|
||||
bottom: "conv5"
|
||||
top: "pool5"
|
||||
pooling_param {
|
||||
pool: MAX
|
||||
kernel_size: 3
|
||||
stride: 2
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc6"
|
||||
type: "InnerProduct"
|
||||
bottom: "pool5"
|
||||
top: "fc6"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu6"
|
||||
type: "ReLU"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
}
|
||||
layer {
|
||||
name: "drop6"
|
||||
type: "Dropout"
|
||||
bottom: "fc6"
|
||||
top: "fc6"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc7"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc6"
|
||||
top: "fc7"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 4096
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0049999999
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.1
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "relu7"
|
||||
type: "ReLU"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
}
|
||||
layer {
|
||||
name: "drop7"
|
||||
type: "Dropout"
|
||||
bottom: "fc7"
|
||||
top: "fc7"
|
||||
dropout_param {
|
||||
dropout_ratio: 0.5
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "fc8"
|
||||
type: "InnerProduct"
|
||||
bottom: "fc7"
|
||||
top: "fc8"
|
||||
param {
|
||||
lr_mult: 1.0
|
||||
decay_mult: 1.0
|
||||
}
|
||||
param {
|
||||
lr_mult: 2.0
|
||||
decay_mult: 0.0
|
||||
}
|
||||
inner_product_param {
|
||||
num_output: 196
|
||||
weight_filler {
|
||||
type: "gaussian"
|
||||
std: 0.0099999998
|
||||
}
|
||||
bias_filler {
|
||||
type: "constant"
|
||||
value: 0.0
|
||||
}
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "accuracy"
|
||||
type: "Accuracy"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "accuracy"
|
||||
include {
|
||||
phase: TEST
|
||||
}
|
||||
}
|
||||
layer {
|
||||
name: "loss"
|
||||
type: "SoftmaxWithLoss"
|
||||
bottom: "fc8"
|
||||
bottom: "label"
|
||||
top: "loss"
|
||||
}
|
150
cars/lr-investigations/lr.ipynb
Normal file
74
cars/split-investigations/split.ipynb
Normal file
@ -0,0 +1,74 @@
|
||||
{
|
||||
"cells": [
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 1,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"import numpy as np\n",
|
||||
"import matplotlib as mpl\n",
|
||||
"from matplotlib import pyplot as plt"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "markdown",
|
||||
"metadata": {},
|
||||
"source": [
|
||||
"# Different Train/Validation/Test Splits\n",
|
||||
"\n",
|
||||
"## Index\n",
|
||||
"0. train prop\n",
|
||||
"1. val prop\n",
|
||||
"2. test prop\n",
|
||||
"3. top-1 accuracy\n",
|
||||
"4. top-5 accuracy\n",
|
||||
"5. last val loss\n",
|
||||
"6. last val accuracy"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": 2,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": [
|
||||
"split_results = np.array([\n",
|
||||
" [50, 5, 45, 8.14, 20.7, 5.77, 8.29],\n",
|
||||
" [50, 25, 25, 7.91, 20.9, 5.59, 8.41],\n",
|
||||
" [70, 15, 15, 15.81, 34.62, 4.92, 16.82],\n",
|
||||
" [80, 10, 10, 20.94, 44.1, 4.39, 24.45],\n",
|
||||
" [90, 5, 5, 20.62, 45.19, 4.17, 30.29]\n",
|
||||
"])"
|
||||
]
|
||||
},
|
||||
{
|
||||
"cell_type": "code",
|
||||
"execution_count": null,
|
||||
"metadata": {},
|
||||
"outputs": [],
|
||||
"source": []
|
||||
}
|
||||
],
|
||||
"metadata": {
|
||||
"kernelspec": {
|
||||
"display_name": "Python 3",
|
||||
"language": "python",
|
||||
"name": "python3"
|
||||
},
|
||||
"language_info": {
|
||||
"codemirror_mode": {
|
||||
"name": "ipython",
|
||||
"version": 3
|
||||
},
|
||||
"file_extension": ".py",
|
||||
"mimetype": "text/x-python",
|
||||
"name": "python",
|
||||
"nbconvert_exporter": "python",
|
||||
"pygments_lexer": "ipython3",
|
||||
"version": "3.9.2"
|
||||
}
|
||||
},
|
||||
"nbformat": 4,
|
||||
"nbformat_minor": 4
|
||||
}
|
18
pyproject.toml
Normal file
@ -0,0 +1,18 @@
|
||||
[tool.poetry]
|
||||
name = "digits-cnn"
|
||||
version = "0.1.0"
|
||||
description = ""
|
||||
authors = ["andy <andy@sarsoo.xyz>"]
|
||||
|
||||
[tool.poetry.dependencies]
|
||||
python = "^3.9"
|
||||
numpy = "^1.20.2"
|
||||
matplotlib = "^3.4.1"
|
||||
jupyterlab = "^3.0.12"
|
||||
pandas = "^1.2.3"
|
||||
|
||||
[tool.poetry.dev-dependencies]
|
||||
|
||||
[build-system]
|
||||
requires = ["poetry-core>=1.0.0"]
|
||||
build-backend = "poetry.core.masonry.api"
|
@ -21,7 +21,7 @@ minimalistic
|
||||
todonotes
|
||||
\end_modules
|
||||
\maintain_unincluded_children false
|
||||
\language english
|
||||
\language british
|
||||
\language_package default
|
||||
\inputencoding auto
|
||||
\fontencoding global
|
||||
@ -97,7 +97,7 @@ todonotes
|
||||
\defskip medskip
|
||||
\is_math_indent 0
|
||||
\math_numbering_side default
|
||||
\quotes_style english
|
||||
\quotes_style british
|
||||
\dynamic_quotes 0
|
||||
\papercolumns 1
|
||||
\papersides 1
|
||||
|